Алгоритм проверки на изменение страницы.

ksnk

прохожий
SelenIT
Сравнение по DIFF подошло бы, но встречаются страницы полностью "вытянутые" в одну строчку.
Впрочем, можно "порезать" страничку по символам </, к примеру и получить свою "разбивку на строки", которую уже сравнивать diff'ом. Да! Идея подходит.
kvf77
Насколько я понял "кража" сопровождается обязательным "показом" контента и выдачей контента за "свой". Своровать и не похвастаться - нелогично :)
 

kvf77

Red Devil
zarus

а - ну конечно - выкачивать страничку каждый раз, чтобы проверить - не менялась ли она - этот то самое кэширование и трафик абалденно экономит
сдается мне что такие извращения ничего экономить не могут - и смысла особого не имеют, кроме как обозначеный мною выше
 

zarus

Хитрожопый макак
Автор оригинала: kvf77
zarus
а - ну конечно - выкачивать страничку каждый раз, чтобы проверить - не менялась ли она - этот то самое кэширование и трафик абалденно экономит
сдается мне что такие извращения ничего экономить не могут - и смысла особого не имеют, кроме как обозначеный мною выше
Выкачивать не каждый раз, а проверять, не изменилось ли содержимое раз, скажем, раз в промежуток времени. А на любые запросы юзеров выдавать хранящуюся в "кеше" страницу.
з.ы. Возможно, Вы и правы, но нельзя же так категорично утверждать... В чем смысл - заниматься кражей контента, и при этом сравнивать одинаковость страниц?
 

kvf77

Red Devil
zarus

я не вижу смысла и в вашем объяснении - десткий сад - поставьте прокси и не парьте мозги
то, что тытаетесь сделать вы - помоему полный маразм - во всяком случае применитьльно к описываемой вами задаче
 

ksnk

прохожий
zarus
А на любые запросы юзеров выдавать хранящуюся в "кеше" страницу
Это действительно - не дело! Это-же не система кеширования, и не web-прокси, а просто чекинг изменения страницы.
 
Сверху