Документация по LinuxLinuxDoc.Ru 🔍
🕛

Как вырезать баннеры из веб-страниц?

Простейший способ - занесение соответствующих хостов - поставщиков рекламы в /etc/hosts с фиктивными ip адресами. Более сложный, но и более гибкий - при помощи прокси-сервера Squid. Чаще всего для фильтрации используют ACL (Access Control List) типа "url_regex" (squid.conf, раздел ACCESS CONTROLS) типа:
    acl Reclama_Banners url_regex ^http://www1.reklama.ru/cgi-bin/banner/* http_access deny Reclama_Banners
Или из файла :
    acl Banners url_regex "/etc/squid/banners" http_access deny Banners
В /etc/squid/banners вписываешь своих врагов (в виде регулярных выражений), например:
    ^http://banners.rambler.ru/advert/.*.gif ^http://kulichki.rambler.ru/reklama/banners/.*.gif ^http://www.*.yandex.ru/cgi-bin/banner/* ^http://www1.reklama.ru/cgi-bin/banner/* ^http://www.reklama.ru/cgi-bin/banner/* ^http://www.reklama.ru/cgi-bin/href/* ^http://www.100mb.net/images/ban/banner.*.gif ^http://www.bizlink.ru/cgi-bin/irads.cgi.* ^http://www.linkexchange.ru/cgi-bin/rle.cgi ^http://www.linkexchange.ru/users/.*/goto.map ^http://www.netcq.com/banners/banner.gif ^http://1000.stars.ru/cgi-bin/1000.cgi
Еще лучше с задачей фильтрации справляется специальная программа-фильтр squidguard squidguard.org, ставится в дополнение к squid. Более полный список баннеродержателей можно получить на pail.pu.ru/ Можно сделать Transparent Proxy lexa.ru/lexa/transparent-proxy.html Transparent Proxy MiniHOWTO: tldp.org/HOWTO/mini/TransparentProxy.html Можно поставить редиректор squirm senet.com.au/squirm/, его задача - подменять одни URLs другими.

Также по теме:
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.
Linux - FAQ по Linux - Как вырезать баннеры из веб-страниц?
Мы в соцсетях ✉