Подход к "правильной" статистике сайта

Asar

Новичок
Подход к "правильной" статистике сайта

Собственно, появилась тут задачка сделать свою сатистику посещаемости пары сайтов.
Ранее на одном из них использовался хотлог, а на другом вообще ничего не было.

Сейчас вылавливаю с помощью $_SERVER рефера, IP, юзер-агента... Отсюда можно сопоставлять IP с юзер-агентом, чтобы получалась очень_приблизительная картинка уникальных посетителей.
Понятное дело, что точно посчитать такой показатель невозможно, но хотелось бы приблизиться к такому...

Вопрос - можно ли для этого взять еще какие параметры с помощью ПХП?

На одном из сайтов логи недоступны - поэтому другого способа там я не вижу.
Вопрос 2 - там, где логи доступны - дадут ли они мне дополнительную информацию? Если дадут - искать прогу для их анализа или делать самому - стоит ли?
 

Кром

Новичок
Все что доступно видно через [m]phpinfo[/m].
В логах сервера лежит та-же информация + обьем скаченного + ответ сервера. Эту информацию можно узнавать и самому, но лог сервера удобнее.

>Если дадут - искать прогу для их анализа или делать самому - стоит ли?
Смотря что за сервер. Для Apache, например, есть очень неплохие анализаторы.

Часть информации можно узнавать чере JavaScript. Разрешение экрана, глубина цвета и т.д.
 

Фанат

oncle terrible
Команда форума
Кром
Яваскрипт тут, вообще-то, совсем не при делах.
То есть, я понимаю, что ты просто делишься информацией, что, мол, можно. Реагируя на якорь "счетчик".
Но если вчитаться в текст, а не только в ключевое слово, то можно увидеть, что
а) интересует учет посетителей. И клиент расценит разрешение именно как способ различать уников.
б) из постановки задачи хорошо видно, что считать предполагается серверным скриптм, а не картинкой. То есть, яваскрипт все равно не при делах.
 

Alexandre

PHPПенсионер
Asar правильный подход через логи.

раз - логи недоступны, то делай пхп-скриптом
по логам еще можно определить, какие роботы грабили твой сайт. тоже интерестная информация. Наш ВЭБмастер ее анализирует.

если логи недоступтны, то значить хостинг чужой :).
тогда лучше делать через пхп-скрипт сразу на оба сайта.
 

Asar

Новичок
Со статистикой, когда логов нет - понятно. Но. Даже когда и есть. У меня они выводятся в следующем виде:

217.118.66.232 - - [02/Feb/2005:00:17:06 +0300] "GET http://************/photo.php" 200 27583
"http://search.rambler.ru/srch?old_q***********set=www"
"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322)"

Т. е. могу выцапать отсюда IP, дату/время, страницу, на которую заходили, реферера, ОС, браузер. То же самое я могу цапнуть с помощью ПХП и без использования логов, а заодно еще и в БД запихнуть.

Кроме того, в строке лога имеется объем запрошенной страницы (27583), код ответа сервера (200)...

Собственно, вот и вся разница. Вопрос: а зачем мне, собственно, пользовать эти логи, если никакой особо полезной для меня информации они не предоставляют, а уже имеется готовое решение для сбора инфы без использования логов (может, я что-то важно пропустил)? Кстати, а если вместо GET в одной из строк указано HEAD - это что ли он заголовки забирал? Где об этом можно поподробнее узнать?
 

Фанат

oncle terrible
Команда форума
То же самое я могу цапнуть с помощью ПХП
неправильно.
из пхп ты можешь записать обращения к пхп скриптам
а заодно еще и в БД запихнуть.
нет проблем логи в обработанном виде запихнуть в бд
а зачем мне, собственно, пользовать эти логи,
например, для экономии времени обслуживания посетителя, не занимаясь обработкой логов на лету.
если никакой особо полезной для меня информации они не предоставляют
если ты думал, что логам предоаставляют какую-то принципиально отличающуюся информацию, чем скрипту, то остается только порадоваться такой наивности :)
а уже имеется готовое решение для сбора инфы без использования логов
Если уже имеется, то можно и не пользоваться логами.
У любой задачи есть больше, чем два решения. И какое выбрать - это выибрает только сам клиент.
Если тебе показалось, что тебя здесь кто-то на что-то уговаривает - ты ошибся.
Где об этом можно поподробнее узнать?
в описании протокола HTTP, разумеется.
 

alexhemp

Новичок
установи awstats и не мучайся. Потом когда увидишь как анализатор работает, поймешь надо что-то писать или нет.

99% случаев этого хватит.
 
Сверху