Счетчик: подсчет уникальных за период

Vinny

Guest
PartizaneN
На самом деле для подсчета уников достаточно хранить для каждого уникального пользователя день когда он заходил на сайт, т.е. (Site_Id, User_Id, Day).

Еще пример для чего нужна такая статистика -- реклама... Очень важно знать сколько уникальных пользователей просмотрело баннер...

Falc
С хитам проблем нет... Их можно суммировать по дням...

-~{}~ 09.02.04 12:51:

PartizaneN
Меня не интересует если там нужный тебе отчет или нет... В этом топике говорят про отчеты по уникам, а он там есть, хоть и кривой...
 

PartizaneN

I speak PHP
>> А если пользователь захочет по всем посетителям, а не только с конкретного рефера?
Что-то я не понял... Что по всем посетителям...?

>> А если пользоваетль хочет знать не только число посетителей, но кол-во хитов
хит+1 )))

Вот тебе совет... Генерить статистику из исходных данных - это изврат... Это возможно если
1)у тебя очень мало сайтов
2) очень много места на винте )))...
3) ты не хранишь статистику вечно...
 

Vinny

Guest
PartizaneN
>Вот тебе совет... Генерить статистику из исходных данных - это изврат...

Это и ежу ясно...
 

PartizaneN

I speak PHP
Ты уж винни извини, но я не тебе отвечал, извини, конечно - это ж твой топик...

Повторяю... У фалка возникла очень даже хорошая идея навернуть твою идею...

Совет... Внимательней вчитывайся )))
 

Falc

Новичок
PartizaneN
>>>> А если пользователь захочет по всем посетителям, а не только с конкретного рефера?
>>Что-то я не понял... Что по всем посетителям...?
Сначало мы расмотривали, ситуацию дла вывода статистики по посетителям пришедшим с конкретного рефера, но пользователю может понадобится и по всем посетителям, со всех реферов в том числе и пустых.


>>Повторяю... У фалка возникла очень даже хорошая идея навернуть твою идею...
У меня нет идей наворачивать его идею, я просто расказываю какие отчеты могут понадобится пользователям. Только за такую подробную статистику можно получать деньги, за кол-во хитов и уников на сайте никто и копейки не заплатит, это все можно получить бесплатно на хотлоге.

>>Вот тебе совет... Генерить статистику из исходных данных - это изврат...
Я тебе показал в каком случае это не изврат.

>>Это возможно если
>>1)у тебя очень мало сайтов
>>2) очень много места на винте )))...
>>3) ты не хранишь статистику вечно...
У меня пока 1-ый вариант, но система растет и кол-во клиентов планируется увеличивать.
 

Vinny

Guest
Коль пошла такая пьянка, может кто подскажет кто как хранит пути по сайту... На ум приходит только дерево, т.е. path(Url_Id, ParentUrl_Id).

Т.е. при первом заходе будет (1, null), при втором (2, 1) и так далее...
 

Falc

Новичок
Vinny
>>На ум приходит только дерево, т.е. path(Url_Id, ParentUrl_Id).
Я просто не вижу других решений :)
 

PartizaneN

I speak PHP
Дерево - это конечно хоршо...

А вот каждый хит писать - это нет... И в твоем случае в том числе... Итак табло (ид юзера, реферер, страница на которую пришел, хиты, дата) все... и не надо писать каждый хит!!! Отсюда же можешь и отчет о каждом юзере брать... И если у тебя сайтов не много - то можешь и еще несколько отчетов из нее генерить... Сделаешь дату в секундах, - сможешь узнать сколько юзеров пришло за 3 минуты 1 секунду )))
 

Vinny

Guest
PartizaneN
Я не писал о хранении в таблице путей каждого хита... Там даже по структуре понятно что каждый хит писаться не будет...
 

Falc

Новичок
PartizaneN
>>Итак табло (ид юзера, реферер, страница на которую пришел, хиты, дата) все... и не надо писать каждый хит

Ты думаешь в такой таблице будет записей сильно меньше чем число хитов? Ты сильно ошибаешься в ней будет примерно на 10% меньше записей чем хитов на сайте. А если дату в секундах то вообще записей в такой таблице будут ровно столько сколько хитов на сайте.

А прежде чем советовать такую структуру базы, тебе стоит поподробнее разобратся в предмете и основах построения баз данных.
 

PartizaneN

I speak PHP
2 Vinny - это я не тебе отвечал...

2 Falc - Ну блина... Как тебе сказать... Число записей будет = числу хостов, а не числу хитов ... А в среднем на нормальных сайтах хитов в 10 раз больше чем хостов )))

И кто говорил, что я делаю дату в секундах... А вот если так сделать, то уж наверное не сравнивать теперяшнюю дату в секундах, с датой в базе )))))))) Есть хорошая такая функция date() ... Советую мануал )))))

2 Винни... А можно по подробнее как ты пути делаешь... Т.е. какие у тебя поля, кроме ид и п_ид... И как ты умудряешься записать не каждый хит (ну конечно же выкидываются посетители с одним хитом - здесь не про это).... Допустим на сайте > 15.000 страниц(это у меня так)... Пути редко повторяются.... Я в затупе ((( Как эту хрень оптимизировать...
 

trigger

Guest
Автор оригинала: PartizaneN
Ты слышал такую поговорку -- "слово серебро, молчание -- золото". Так вот -- она абсолютно верна! Ты бы чем говорить, послушал людей бы... Falcа, например...
Всякую географию, ссылы, пути у валялы можно взять из таблицы day_log ... Подробнее про это писать нет смысла...
Ты название видишь? DAY_log. Понятно?
А минимальный период час - это вообще не задача... Одной таблицой больше, одной меньше... Если ты конечно не имеешь в виду - сколько уников пришло с 10.00 вчера по 9.00 сегодня...
И это решаемо, только надо ли???
ЕЕЕпть! А для кого я распинался про асимптотики, n^2 и так далее. Думаю, второй раз объяснять нет смысла... Ты хоть на сабж посмотри....
... И не такие уже это миллиарды записей...)))
Вопрос решен, если ты не понял. Посмотри мои и Falcовые итоги.

-~{}~ 11.02.04 09:15:

Автор оригинала: PartizaneN
Вот тебе совет... Генерить статистику из исходных данных - это изврат... Это возможно если
1)у тебя очень мало сайтов
2) очень много места на винте )))...
3) ты не хранишь статистику вечно...
Ты вообще читал топик сначала? Прежде чем писать сюда?
 

Falc

Новичок
PartizaneN
>>Число записей будет = числу хостов, а не числу хитов ... А в среднем на нормальных сайтах хитов в 10 раз больше чем хостов )))

Ты хоть следишь за диалогом?
Число записей будет = числу хостов на каждой странице (кстати на одном хосте может быть не один посетитель, так что слово хост тут не совсем корректно). Ты думаешь много посетителей заходят на одну и туже страницу по десять раз?

-~{}~ 11.02.04 10:50:

PartizaneN
>>Допустим на сайте > 15.000 страниц(это у меня так)... Пути редко повторяются.... Я в затупе ((( Как эту хрень оптимизировать...

Обычно счетчики показывают не все пути а наиболее повторяющиеся, поэтому не повторяющиеся пути можно чистить, конечно это вызывает некоторую погрешность, но в любой статисти с счетчика столько погрешностей что на эту можно не обращать внимания :)
 

Vinny

Guest
PartizaneN
Кроме идентификаторов там можно вставить счетчик чтобы потом выбирать самые популярные пути... В остальном слушайся Falc-а :)))
 

PartizaneN

I speak PHP
>Число записей будет = числу хостов на каждой странице
>(кстати на одном хосте может быть не один посетитель, так
>что слово хост тут не совсем корректно). Ты думаешь много
>посетителей заходят на одну и туже страницу по десять раз?

Все ... я от тебя устал... Ты просто непробиваем... Как я понял ты хочешь видеть не только страницу, на которую пришел юзер и отчет за любой период по этим страницам и реферерам... А ты хочешь еще записать куда дальше он по сайту пошел и учесть в отчете и эти страницы, а не просто записать сколько он хитов сделал... ))) Удачи...

>Обычно счетчики показывают не все пути а наиболее
>повторяющиеся, поэтому не повторяющиеся пути можно
>чистить, конечно это вызывает некоторую погрешность, но в
>любой статисти с счетчика столько погрешностей что на эту
>можно не обращать внимания

У меня сейчазз сердце не выдержит... А ЗАЧЕМ ТОГДА ТЕБЕ КАЖДУЮ СТРАНИЦУ ПО КОТОРОЙ СЕРФИТ ЮЗВЕРЬ УЧИТЫВАТЬ В ОТЧЕТЕ О РЕФЕРЕРАХ???


>Ты слышал такую поговорку -- "слово серебро, молчание --
>золото". Так вот -- она абсолютно верна! Ты бы чем говорить,
>послушал людей бы... Falcа, например...

Кароче ты считаешь, что по примеру фалка надо просто писать информацию о каждом хите в базу... Надеюсь ты там один такой в опен.бай )))

>Ты название видишь? DAY_log. Понятно?

Ты хоть сам понял, что написал?? А теперь осознай, что я имел в виду....

>Ты вообще читал топик сначала? Прежде чем писать сюда?
Встречный вопрос... А ты предыдущие сообщения прочитал прежде чем отвечать...?

2 Vinny - а вот это и плохо, что только самые популярные пути... Думаю сделать для своего сайта пути, которые длиннее 3 страниц... Остальным - вообще не буду... Статистика у меня бесплатная...
 

Falc

Новичок
PartizaneN
>>А ты хочешь еще записать куда дальше он по сайту пошел и учесть в отчете и эти страницы, а не просто записать сколько он хитов сделал... ))) Удачи...

У меня это уже есть и прекрасно работает :)

>>А ЗАЧЕМ ТОГДА ТЕБЕ КАЖДУЮ СТРАНИЦУ ПО КОТОРОЙ СЕРФИТ ЮЗВЕРЬ УЧИТЫВАТЬ В ОТЧЕТЕ О РЕФЕРЕРАХ???
Пути по сайту и хиты пользователей это разная инфа, из древовидных путей, ты устанешь генерить отчеты о которых я говорил.

>>Статистика у меня бесплатная...
Интузиаст? На чем бабло поднимать собираешься? Ставлю ящик пиво на то что у хотлога статистикак богаче твоей. А кол-во запросов к системе как у хотлога тебе и не снилось :)
 

Vinny

Guest
PartizaneN

>У меня сейчазз сердце не выдержит... А ЗАЧЕМ ТОГДА ТЕБЕ
>КАЖДУЮ СТРАНИЦУ ПО КОТОРОЙ СЕРФИТ ЮЗВЕРЬ УЧИТЫВАТЬ В
>ОТЧЕТЕ О РЕФЕРЕРАХ???

У тебя неправильные ассоциации... Было сказано "можно чистить", но ведь можно и не чистить... Вот только я очень сомневаюсь в том что малопосещаемые пути кто-нить посмотрит...

У меня есть маленький счетчик который висит пол года на сайте с 30-70 уников в день... Так вот там накопилось более 1200 записей только доменов рефереров, а еще есть страницы...

Все это я веду к тому, что малопосещаемые пути, как и рефереры, никого не интересуют и только засоряют базу...


>2 Vinny - а вот это и плохо, что только самые популярные пути...
>Думаю сделать для своего сайта пути, которые длиннее 3
>страниц... Остальным - вообще не буду... Статистика у меня
>бесплатная...

Я писал про популярные пути... Да и "популярность" может подразумевать под собой от 2 до бесконечности страниц в пути... Не вижу смысла хранить пути которые делают меньше 90% хитов, но занимают 90% базы...
 

Falc

Новичок
Vinny
>>что малопосещаемые пути, как и рефереры, никого не интересуют и только засоряют базу...

Не скажи реферы могут интересовать, напрмер с какого нибудь каталога у тебя может идти толпа посетителей и все в пустую (не одного заказа), а с какой нибудь ссылки в статье которая рекламирует товар продаваемый у тебя на сайте, может прийти несколько человек и половина из них купят этот товар :)
 

trigger

Guest
Vinny
... что малопосещаемые пути, как и рефереры, никого не интересуют ...
На open.by 62% путей -- главная страница и все. Не знаю, как другим, но мне были бы интересны малопосещаемые пути...
 

Falc

Новичок
trigger
>>На open.by 62% путей -- главная страница и все. Не знаю, как другим, но мне были бы интересны малопосещаемые пути...

Как правило интересуют длинные частопеосещаемые пути. Я использую примерно такую формулу:

ORDER BY ( LOG10( depth ) * count ) DESC
 
Сверху