dvp
Новичок
Борьба с picture grabber
Мастера. Мучит меня который день вопрос: как же мне защитить мой сайт, который является каталогом обоев, защитить от так называемых граберов картинок (которые ходят по сайту и сливает все встретившиеся картинки)?
Понятно, что 100% защита - это не показывать картинки никому, но всё-таки какие-никакие извороты придумать можно.
Какие у меня самого мысли:
- первая идея была использовать jaascript для генерации src картинок. Защита надёжная (чтобы сграбить придётся изучить сайт и сделать под него индивидульную грабилку, а я уж постараюсь сделать javascript непредсказуемым), но вот не люблю я его - не у всех он есть (включен), а с выходом всяких SP2 вообще страшно его пользовать стало - чуть что - "сайт пытается нарушить безопасность".... в общем эту мысль я отмёл сразу.......
- второй вариант: составить список признаков этих самых грабберов (что они в HTTP-запросах пишут: User-Agent, Accept), и если граббер имеет глупость представить себя "на пробел" не так как браузер, под который он маскирется, то банить его..... в принципе на практике результативно оказалось: парочка грабберов облажалась и не некорректно смаскировалась под IE6, но не все .......
Минусы такого подхода очевидны: придётся следить за обновлениями браузеров и Грабберов. Да и персоняльно под мой сайт не сложно будет написать граббер ...........не катит.........
- Третий вариант: Считать частоту хитов с хоста, и если она "нечеловеческая" - банить. Вариант хороший, но ровен час, как какому-нить посетителю не повезёт и он зайдёт с одного хоста с граббером.
Этот вариант мне не по душе.
- Четвёртый вариант - мой любимый: Сделать сайт на XSL(для тех, кто поддерживает, а для остальных XHTML). Тогда грабберы, которые косят под IE6 (а именно так они и делают чаще всего), будут получать XML-ку и обломаются. Но те, кто косит под Opera (а вдруг такие есть) и те, кто позволяют вписать нужный User-Agent всё-таки смогут получать XHTML, а значит и урлы картинок.
Хоть вариент не ахти, но он не мешает двум другим, поэтому его я реализовал ( http://autowp.ru/ ).
Теперь думаю, что делать с "совсем умными" грабилками? Не поможете?
Да, если кто-нибудь знает названия грабилок - неполенитесь - напишите. Хочу изучить их.
p.s. картинки мне не жалко - мне за трафик платить жалко
-~{}~ 19.01.05 02:03:
Ой :-( Случайно вместо "PHP для продвинутых" создал топик в Юморе. Модераторы, не исправите?
Мастера. Мучит меня который день вопрос: как же мне защитить мой сайт, который является каталогом обоев, защитить от так называемых граберов картинок (которые ходят по сайту и сливает все встретившиеся картинки)?
Понятно, что 100% защита - это не показывать картинки никому, но всё-таки какие-никакие извороты придумать можно.
Какие у меня самого мысли:
- первая идея была использовать jaascript для генерации src картинок. Защита надёжная (чтобы сграбить придётся изучить сайт и сделать под него индивидульную грабилку, а я уж постараюсь сделать javascript непредсказуемым), но вот не люблю я его - не у всех он есть (включен), а с выходом всяких SP2 вообще страшно его пользовать стало - чуть что - "сайт пытается нарушить безопасность".... в общем эту мысль я отмёл сразу.......
- второй вариант: составить список признаков этих самых грабберов (что они в HTTP-запросах пишут: User-Agent, Accept), и если граббер имеет глупость представить себя "на пробел" не так как браузер, под который он маскирется, то банить его..... в принципе на практике результативно оказалось: парочка грабберов облажалась и не некорректно смаскировалась под IE6, но не все .......
Минусы такого подхода очевидны: придётся следить за обновлениями браузеров и Грабберов. Да и персоняльно под мой сайт не сложно будет написать граббер ...........не катит.........
- Третий вариант: Считать частоту хитов с хоста, и если она "нечеловеческая" - банить. Вариант хороший, но ровен час, как какому-нить посетителю не повезёт и он зайдёт с одного хоста с граббером.
Этот вариант мне не по душе.
- Четвёртый вариант - мой любимый: Сделать сайт на XSL(для тех, кто поддерживает, а для остальных XHTML). Тогда грабберы, которые косят под IE6 (а именно так они и делают чаще всего), будут получать XML-ку и обломаются. Но те, кто косит под Opera (а вдруг такие есть) и те, кто позволяют вписать нужный User-Agent всё-таки смогут получать XHTML, а значит и урлы картинок.
Хоть вариент не ахти, но он не мешает двум другим, поэтому его я реализовал ( http://autowp.ru/ ).
Теперь думаю, что делать с "совсем умными" грабилками? Не поможете?
Да, если кто-нибудь знает названия грабилок - неполенитесь - напишите. Хочу изучить их.
p.s. картинки мне не жалко - мне за трафик платить жалко
-~{}~ 19.01.05 02:03:
Ой :-( Случайно вместо "PHP для продвинутых" создал топик в Юморе. Модераторы, не исправите?