База данных для статистики посещений

hammet

Новичок
База данных для статистики посещений

Добрый день.
В поиск http://phpclub.ru/talk/search.php?action=showresults&searchid=1874532&sortby=after&sortorder=descending
я уже ходил, прошу не отправлять меня туда вновь.
У меня стала задача создания статистики посещений сайта в виде гистограммы. Отчет будет выводиться по последним 30 дням, т.е. строиться график вида x-дни, y-хиты/хосты.
+ к этому будет выводиться общая статистика за весь период работы сайта. Может быть еще какието среднеарифметические значения, но думаю это уже не влияет на структуру таблиц бд, тут все просто.
Кто может описать приблизительную схему построения таблиц для таких отчетов?
Спасибо.
PS желательно без использования крона
 

Фанат

oncle terrible
Команда форума
Обычная таблица. Лог всех обращений.
метка времени, страница, айпи адрес.
 

hammet

Новичок
Т.е вы предлагаете объединить все в одной таблице?
Я выложу свой вариант, а вы скажите что об этом думаете, ок?
Таблица которая будет хранить данные об уникальных хитах за последние 30 дней.
PHP:
CREATE TABLE `stat_hits` (
  `id` bigint(20) unsigned NOT NULL auto_increment,
  `user_ip` bigint(20) unsigned NOT NULL default '0',
  `putdate` timestamp NOT NULL default CURRENT_TIMESTAMP,
  PRIMARY KEY  (`id`)
) ENGINE=MyISAM;
Остальные таблицы хранят записи по популярности браузеров, ос, страниц сайта, фиксированные поля, обновляются инкрементно....
И таблица с общей статистикой хитов, в которую ежемесячно будет переписываться сумма хитов из преведенной табл.

-~{}~ 11.09.07 12:55:

Mr_Max
Спасибо за ссылку. Я не знал про Webalizer. Единственный вопрос, он читает ведь логи апача, а логи бывают разные и содержат разную информацию....т.е. все это конфигураблится?
 

Фанат

oncle terrible
Команда форума
Не понимаю смысла в этой таблице.
если не нужна статистика, а нужна только цыферка, то зачем вообще бд майэскюэль?
писать в файл цифру - да и все.

и ни для id, ни для ip поле типа bigint не нужно. достаточно int

-~{}~ 11.09.07 12:59:

он читает ведь логи апача
да, он читает логи апача. то есть, статистика у него в два раза достовернее.
а логи бывают разные и содержат разную информацию
бедные пользователи вебализера. они-то этого не знают!
 

hammet

Новичок
и ни для id, ни для ip поле типа bigint не нужно. достаточно int
мммм....я думал ip может быть 4 и 8 байт. Ок, спасибо.

бедные пользователи вебализера. они-то этого не знают!
я имел ввиду что не на каждом сервере в лог пишется реферер например....т.е. мы зависим от конфигурации апача хостера. Или я не прав.

-~{}~ 11.09.07 13:35:

ээээ....пардон. Я только что скачал и скомпилил вэбализер.....но он же на сях о_О
Я думал прикрутить его к CMS....
 

vovanium

Новичок
Вообще-то довольно убогая статистика у webalizer, referer без параметров, т.е. к примеру по ссылке с этой страницы форума будет ссылка http://phpclub.ru/talk/showthread.php, которая ведет в никуда...
Нет разделения на ботов и нормальных юзеров, определение географии по зоне хоста юзера, нафиг никому не нужно.
Не говоря уже об отсутствии, какой либо более подробной инфе о посетителях.
Единственный плюс это отображение трафика и ошибок (хотя и это сомнительно, т.к. нет инфы о страницах которые эти ошибки выдавали).
 

Mr_Max

Первый класс. Зимние каникулы ^_^
Команда форума
vovanium
Зачастую этого достаточно.
Есть ещё AwStats

У вас есть что предложить?
Так не молчите. :)
 

vovanium

Новичок
У вас есть что предложить?
Вообще пока юзаю свою систему статистики.
Из существующих "боксовых", понравилась разве что платная CNStats, хотя и кривова-то написана, но толку от неё намного больше, чем от webalizer и т.п.

Еще один из минусов систем статистики на основе логов, они считают скачивания картинок. Тогда как большинству абсолютно пофиг сколько раз была скачана к примеру однопиксельная картинка типа spacer.gif (или другие картинки дизайна страницы) и это при том что поскольку картинки дизайна выводятся на всех страницах сайта, то они и являются самыми популярными файлами по скачиванию...
 

Фанат

oncle terrible
Команда форума
подсчет скачивания картинок - как раз плюс.
картинок контента (и других не-скриптовых файлов - музыки, пдф-ов и так далее)
а картинки дизайна (а так же css js и прочее) - можно фильтровать
 

vovanium

Новичок
картинок контента (и других не-скриптовых файлов - музыки, пдф-ов и так далее)
В таких случаях и статистика встраиваемая в CMS вполне неплохо справляется, т.к. CMS контролирует вывод всего контента (так как в любом случае чаще всего нужно обеспечивать антиличинг и прочий контроль за скачиваемым контентом).
 

hammet

Новичок
От вэбалайзера отказался, уже почти дописал собственную, с диаграммами, таблицами, отчетами и т.д.. Только то что мне нужно, ничего лишнего. В любой момент можно расширить функционал :)
Я доволен.
По крайней мере вышло получше чем софттаймовский пауэркаунтэр.
 

Фанат

oncle terrible
Команда форума
имхо, самое интересное в любой системе статистики - анализ рефереров.
и почти нигде он не реализован по-человечески.
 
Сверху