Защита счётчика от накрутки

lorien

Новичок
Защита счётчика от накрутки

Пишу счётчик. Что делать, чтобы избежать накрутки счётчика?

Если в понятие хоста включать ip ( REMOTE_ADDR или выцепленный из хедеров от проксей) и юзер-агента, то тогда возникает проблема фальсификации информации ( хэдеров от проксей, хэдера юзер-агента и т.д.)

Мы тут подумали и решили, что накрутки избежать нельзя и её можно лишь установить и принять меры...

Это правильно или следует на начальном этапе фильтровать информацию, которая попадает в сырой лог?
 

440hz

php.ru
Re: Защита счётчика от накрутки

Автор оригинала: lorien
Пишу счётчик. Что делать, чтобы избежать накрутки счётчика?
э-э-э ... счетчик он для себя один или считать будем чужие сайты?
 

Фанат

oncle terrible
Команда форума
Можно делать и то и то.
только непонятен смысл всего этого.
если это ваш сайт, то кому придёт в голову накручивать его?
Если это чужой сайт, то кому придёт в голову накручивать его, есслитак можно нафиг вылететь из рейтинга?
 

python

Новичок
наверное это affiliates engine?
я бы сделал куку и ip. если нет ни того ни другого - просто не засчитывать клик
 

440hz

php.ru
Автор оригинала: Фанат
если это ваш сайт, то кому придёт в голову накручивать его?
я лично знаю один крупный сайт (могу в привате сказть адрес) где шеф выдает премии основываясь на показаниях счетчиков почещения страниц. ребята регулярно его подкручивают.

Автор оригинала: Фанат
Если это чужой сайт, то кому придёт в голову накручивать его, есслитак можно нафиг вылететь из рейтинга?
накрутил конкурента. он вылетел. ты первый. 8)

ИМХО - счетчики это от лукавого. Но тред не об этом.

можно подробнее какой счтчик? java-код на странице с вызовом или на каждом вызываемом скрипте обработчик?

-~{}~ 16.09.05 15:39:

Автор оригинала: python
я бы сделал куку и ip. если нет ни того ни другого - просто не засчитывать клик
в свое время добавлял 30 секундный интервал не засчета вызова.
 

lorien

Новичок
Я пишу сервис статистики, что-то типа warlog,spylog.
На страницах сайта вызывается картинка моего счётчика, параметры идут в сырой лог. По таймеру лог обрабатывается и всё это дело заносицца в таблицы отчётов.

С подобным проектом сталкиваюсь в первый раз, так что пока не в курсе особо, как там оно и где будет тормозить (видимо, приём данных в Бд, извлечение данных из БД для отчётов).

Для статистики надо не только уникальные клики, но также налюдать за последовательностью кликов(сессией). Пока решили пихать в куку уникальный id-сесссии, чтобы прослеживать перемещение юзверя по сайту.

Также интересно до каких пор можно юзать php+MySQL для сбора данных и интерфейса для юзверей т.е. при какой нагрузке сервер благополучно загнётся. Можно ли вообще юзать php для сбора данных от счётчиков?
 

python

Новичок
куку, айпи, контроль скорости (10 страниц в минуту например), но всё равно - при желании накрутят :(

как и везде, 100% уверенности не будет никогда, сколько бы всего не проверяй
 

lorien

Новичок
Код:
контроль скорости (10 страниц в минуту например)
Нереально, потому как я писал невозможно 100% отличать хосты.
Кулхацкер напишет скрипт, который будет генерить разные user-agent, разные X_FORWARDED_FOR и т.д., чтобы эмулировать разные хосты, которые якобы лезут через один прокси.

Никто не знает, учитывают ли обычно сервисы статистики пользователей, сидящих за прозрачными прокси или забивают на них?
 
Сверху