Определить заход ПС на сайт?

Духовность™

Продвинутый новичок
Определить заход ПС на сайт?

Привет! Скажите, у кого-нибудь есть полный список всех директив USER_AGENT которыми представляются ведущие ПС? Ну и какой-нибудь наработанный код, что бы с нуля не писать.

И вообще, как писать код на принадлежность юзер агента к ПС? Достаточно ли сравнивать ключевые слова со строкой HTTP_USER_AGENT типа так
PHP:
strpos ($_SERVER['HTTP_USER_AGENT'], 'YandexImages')
или надо полностью
PHP:
$_SERVER['HTTP_USER_AGENT'] == 'Mozilla/5.0 (compatible; YandexImages/3.0; +http://yandex.com/bots)'
 

dimagolov

Новичок
гугл рулит. смотри статистику сайтов по поисковым машинам, исходники анализаторов логов, они еще должны регулярно обновлять свои базы.
 

Духовность™

Продвинутый новичок
Уа! Как все сложно то.

А зачем мне в гугль смотреть? Ты имеешь в виду гугль аналитик?
 

Dovg

Продвинутый новичок
мы образаем так:

Код:
if ($http_user_agent ~* "(google|yahoo|slurp|msn.*bot|bot|detectURL|AcadiaUniversityWebCensusClient|Accoona|Apexoo|appie|crawler|spider|Bigsearch|BlogBridge|Bloglines|Drupal|Teoma|inktomi|Infoseek|Scooter|Lycos|alexa|findlinks|Alltheweb|Exalead|Xenu|curl|yandex|StackRambler|Roboo|ia_archiver|test/1.0|check_http|SWeb.ru|PHP|dvget|Wget|Mail.Ru/1.0)") {
	set $is_bot 1;
}
Но в нашем случае 100% точность не важна.
 

Dovg

Продвинутый новичок
В нашем случае и то и другое - боты. Т.е. не люди.

Sweb.ru - так подписываются запросы curlа, с этого хостинга.
Drupal - видимо популярная cms так подписывается, когда ходит по чужим сайтам.
 
Сверху