Теория вероятностей

varan

Б̈́̈̽ͮͣ̈Л̩̲̮̻̤̹͓ДͦЖ̯̙̭̥̑͆А͇̠̱͓͇̾ͨД͙͈̰̳͈͛ͅ
Кто-нибудь помнит теорию вероятностей?
Вот такая вот задачка:

Допустим 1000 посетителей сайта приносит доход x долларов.

Сколько посетителей сайта нужно учесть, чтобы узнать это x с вероятностью 0.95 и погрешностью в 0.5 доллара?
 

varan

Б̈́̈̽ͮͣ̈Л̩̲̮̻̤̹͓ДͦЖ̯̙̭̥̑͆А͇̠̱͓͇̾ͨД͙͈̰̳͈͛ͅ
:)
я имел в виду, что они в среднем приносят x долларов
 

флоппик

promotor fidei
Команда форума
Партнер клуба
varan, тут к сожалению тервера мало. Тервер равномерные случайности рассчитывает, а в платежах пользователей в основном закономерности. Но ответ очевиден, в твоем случае для точности в 0.95 нужно посчитать 950 пользователей из 1000 :)
 

varan

Б̈́̈̽ͮͣ̈Л̩̲̮̻̤̹͓ДͦЖ̯̙̭̥̑͆А͇̠̱͓͇̾ͨД͙͈̰̳͈͛ͅ
varan, тут к сожалению тервера мало. Тервер равномерные случайности рассчитывает, а в платежах пользователей в основном закономерности.
Для простоты будем рассматривать нормальное распределение (или как там оно называлось)

Но ответ очевиден, в твоем случае для точности в 0.95 нужно посчитать 950 пользователей из 1000 :)
Нет, не очевиден, потому что есть еще доверительный интервал - 1 доллар, и от него все зависит. Т.е. если утрировать, то если брать точность плюс-минус сто миллиардов баксов, то мне и считать никого не надо, потому что и так ясно что будет входить в интервал

Расплывчатый прогноз "может будет солнце, может дождь, а может и снег" сбудется с большой вероятностью, а прогноз " -13.5 градусов цельсия" - фиг там
 

флоппик

promotor fidei
Команда форума
Партнер клуба
т.е. ты хочешь посчитать достаточный размер репрезентативной выборки, с выбранной погрешностью?
Для начала, непонятен размер твоей погрешности относительно среднего платежа. Если ты за платеж считаешь сотни баксов, то для погрешности в 0,5 доллара нужно посчитать всех. Иначе даже один неучтенный пользователь уже ломает погрешность. Другое дело, если у тебя платеж = 1 центу. Тогда ты можешь отбросить 50 пользователей, и впишешься в погрешность.
Грубо говоря, ты хочешь рассчитать средний платеж, через значение которое зависимо от него. Но, я могу и ошибатся, да.
 

dimagolov

Новичок
это не тервер а статистика.

начни с того, что посчитай средние платежи клиентов (разными методами) и отклонения. потом посмотри по какому среднему отклонения можно свести в максимально компактные группы, в такие, чтобы вписывались в погрешность. после этого, если предположить, что структура пользователей неизменна, то доход у будет ф-ей от кол-ва.

если провести анализ исторических данных, то можно поискать зависимость распределения пользователей от времени. если она есть и статистически достоверна, то модель тоже будет достоверной.
 

varan

Б̈́̈̽ͮͣ̈Л̩̲̮̻̤̹͓ДͦЖ̯̙̭̥̑͆А͇̠̱͓͇̾ͨД͙͈̰̳͈͛ͅ
это не тервер а статистика.

начни с того, что посчитай средние платежи клиентов (разными методами) и отклонения. потом посмотри по какому среднему отклонения можно свести в максимально компактные группы, в такие, чтобы вписывались в погрешность. после этого, если предположить, что структура пользователей неизменна, то доход у будет ф-ей от кол-ва.

если провести анализ исторических данных, то можно поискать зависимость распределения пользователей от времени. если она есть и статистически достоверна, то модель тоже будет достоверной.
мда. Я думал, будет какая-нибудь одна формула и всё :)
В любом случае, спасибо, теперь примерно понятно что к чему
 

Sherman

Mephi
Да-да, dimagolov дело говорит, попробуй сначала определить распределение и среднее.

Только надо сначала понять, какое распределение доходов по юзерам. Оно может быть вовсе не равномерным и даже не нормальным. Все зависит от сервиса.

Скажем, вдруг из той тысячи, реально 20-30 юзеров приносят 80% дохода? Тогда потеря 10-15 таких юзеров приведет к существенному падению доходов, а вероятность _потери_ таких _юзеров_ опять же может быть не одинакова, потому что снова распределение не равномерное.

Зная распределение, можно вполне посчитать дисперсию, а отсюда построить график плотности вероятности.

http://ru.wikipedia.org/wiki/Среднеквадратическое_отклонение
 

grigori

( ͡° ͜ʖ ͡°)
Команда форума
это не статистика, а экономический анализ рынка и маркетинг (да-да, маркетинг - это не реклама)
забейте, это отдельная профессия
 
Сверху