Системы сбора статистики

igor_ua

Новичок
Системы сбора статистики

Подскажите пожалуйста, системы по сбору статистики.
Задача такая: есть выделенный сервер, на нем будет висеть сайт в одну страничку, с которого будут идти редиректы на др. сайт.
Нужна статистика на базе:
php/perl/apache logs
т.е. javascript счетчики не подходят :(

Знаю:
- cnstats (http://www.cn-software.com/)
- awstats (http://awstats.sourceforge.net/)
- еще есть статистика битрикс (есть вариант поставить только ради статистики)

Вопрос собственно в том, что лучше всего считает статистику?
Например если стоит статистика битрикса и google analytics, то гугл считает примерно на 10-20% меньше хостов/хитов чем битрикс.

А тут нужно очень-очень точно считать кто/откуда и когда пришел.

Какие есть еще варианты?

Спасибо!
 

AmdY

Пью пиво
Команда форума
есть подозрения, что google analytics режет из статистики известных ботов, поэтому получается меньше.
 

Фанат

oncle terrible
Команда форума
Гугль по очевидным причинам не считает клиентов с отключенным жавскриптом. То есть, к примеру, меня.
А так же директ линки.

Если
нужно очень-очень точно считать кто/откуда и когда пришел.
то
анализатор server logs
если ты не понимаешь очевидности этого ответа, то доложи начальству о своей профнепригодности.

главная проблема не в том, чем считать, а в том ЧТО считать. то есть, надо искать не "хорошую систему", а "хорошую систему, которая считает по логам"
из перечисленного по логам считает австатс, остальных не знаю.

-~{}~ 07.06.09 09:04:

ответом же на вопрос " что лучше всего считает статистику" является, опять же, очевидно
свой анализатор
поскольку что такое "лучше" никто не знает. Куча компаний зарабатывает бабло на агрегации и анализе статистики. Постоянно придумывают новые идеи. Наивно думать, что опенсорсный скриптик будет отвечать всем запросам.

-~{}~ 07.06.09 09:12:

австатс, кстати, это агрегатор, кажется. то есть, единичные записи " кто/откуда и когда пришел" он не хранит, насколько я знаю
 

fixxxer

К.О.
Партнер клуба
>> - еще есть статистика битрикс (есть вариант поставить только ради статистики)
Диалог с клиентом, рассказанный мне администратором хостинга (приблизительно).

- у меня сайт [на битриксе] тормозит опять, после переезда на впс
- посмотрели - нагрузку создает модуль статистики, отключите его и нагрузка спадет
- !@#!#, я из-за этого модуля битрикс и покупал!
- в этом случае можем предложить выделенный сервер, вот прейскурант
- !#!#!@#

там все хиты валятся в таблички, без какой либо агрегации. достаются данные генерируемыми скриптом sql запросами с джойнами на 100500 таблиц с filesort-ами :)
 

igor_ua

Новичок
Автор оригинала: *****
Если
то
если ты не понимаешь очевидности этого ответа, то доложи начальству о своей профнепригодности.
да понятно, что логи апача самые точные, но ЗАЧЕМ мне писать обработчики логов, если уже могут быть решения??? Когда приходит на форум чел. и говорит, что пишет свою цмс - все ему кричат - что не нужно этого делать, ищи либо готовую, либо фреймворк. С системой статистики - я считаю тоже самое. Уже есть решения.
Я нигде не писал, что обязательно нужно бесплатное, готовы платить.

Просто сделать нужно было это быстро и писать свое решения абсолютно нет смысла.

Спасибо за ответ.

-~{}~ 07.06.09 14:12:

fixxxer
Да про битрикс знаю ))
статистика там тормозит иногда жутко. Но если тут будет не мега трафик идти, битрикс в которой будет включена только статистика - думаю будет работать.

И честно говоря, не думаю что статистика по логам апача и статистика, которая генерится при "дергании" пхп скрипта должны отличаться...
 

vovanium

Новичок
а чем не устраивает cnstats не идеальный конечно, но пошустрее битрикса, и статистика вполне неплохая, получше всяких анализаторов логов.
 

igor_ua

Новичок
в принципе устраивает. Спрашиваю просто, может быть есть еще лучше )
 

vovanium

Новичок
которая генерится при "дергании" пхп скрипта должны отличаться
Отличаться не будет, если тебе нужны только общие данные, типа количество хитов, хостов, рефы. Но в логи не попадают многие дополнительные данные по посетителю, плюс в логах нет куков (которые обычно ставятся системами статистики)
Ну и конечно отображение инфы в cnstats намного лучше, чем в awstats (или другом парсере логов)

-~{}~ 07.06.09 16:44:

igor_ua
Спрашиваю просто, может быть есть еще лучше
Со статистикой дела хуже чем с CMS-ками, имхо на данный момент лучший вариант cnstats, поэтому кстати занялся своим скриптом статистики, нужно же конкуренцию составить :)
 

igor_ua

Новичок
vovanium
Со статистикой дела хуже чем с CMS-ками, имхо на данный момент лучший вариант cnstats, поэтому кстати занялся своим скриптом статистики, нужно же конкуренцию составить
ну на счет конкуренции... если бы не такая задача (считать нельзя javascript-ом), то я бы ставил google analytics и не думал бы даже... Их статистике вроде бы доверяют как рекламодатели, так и пользователи.

Но наверное Вы правы, место где развернуться в этой области еще есть :)
 

vovanium

Новичок
google аналитикс как раз и нужен для рекламодателей ;) т.к. это сторонняя независимая система учета, а свою систему в принципе всегда можно подкрутить чтобы хит за 2 считала к примеру.
Но google аналитикс не дает инфу о реальной нагрузке на сайт, т.к. абсолютно не учитывает статистику по ботам к примеру, кроме того у меня статистика собирает также инфу времени генерации страниц, можно прямо в статистике видеть слабые места
 

grigori

( ͡° ͜ʖ ͡°)
Команда форума
Кто мешает вести несколько видов: и гугл, и по логам, и cnstats ?
Кто изучал статистику как науку, знает, что при аггрегации неизбежны искажения, а разные подходы увеличивают точность.
 

Фанат

oncle terrible
Команда форума
grigori
чтобы делать агрегацию, нужны данные. а если какая-то система их не имеет вовсе, то смысл агрегировать?
 

Alexandre

PHPПенсионер
Кто мешает вести несколько видов: и гугл, и по логам, и cnstats ?
чем больше систем сбора статистики - тем больше разброс данных
но систем должно быть несколько - для надежности

есть много разных (платных и нет ) анализаторов логов - это самая точная статистика
 
Сверху