Мат. анализ - рейтинг на сайте

Rezec

По пиву? (socket80)
Мат. анализ - рейтинг на сайте

Тема появлялась, хочу продолжить.
Есть рейтинг инфы на сайте, люди ставят оценки от 1 до 5. В базе хранится сумма(SUM) и количество проголосовавших(VOTES). Теперь можно сделать рейтинг по кликам, по средней оценке. Но со средней оценкой проблема - если материал только появился и ему поставили 5, то он незаслуженно станет выше всех. В итоге вывели свою формулу.
PHP:
obshee_srednee = 2.5;
lichnoe_srednee = SUM/VOTES;
reiting = (lichnoe_srednee - obshee_srednee) * VOTES;
В итоге получается число которое может быть как положительным так и отрицательным.
Положительное значение означает автоматическое попадание в список лучших.
Переменную
PHP:
obshee_srednee
можно изменять, тем самым регулировать “границу реагирования”.
Под это наверное можно подвести вышку. Но какую и как не знаю. Какие будут соображения?
P.S. При стремлении числа проголосовавших к бесонечности, этот алгоритм дает неплохие результаты :)
 

lanka

Новичок
> Под это наверное можно подвести вышку. Но какую и как не знаю. Какие будут соображения?

По поводу математической базы, что можно подвести по ваши рассуждения. Есть такой раздел теории вероятности - математическая статистика. Там подробно описываются все, что связано с множествами, выборками, средними значениями, коррелияциями и так далее.

Чтобы не искать книжек -
http://www.physfac.bspu.secna.ru/books/mathstat/
прекрасный учебник по матстатистике в электронном виде.

http://teorver-online.narod.ru/ -
учебник по теории вероятности

http://www.nsu.ru/mmf/tvims/chernova/tv/lec/node41.html -
термины из теории вероятностей, нужные для вашей задачи.

http://www.nsu.ru/mmf/tvims/chernova/tv/lec/lec.html -
этот учебник полностью (лекции для 1 курса)


PS "Вышка" - это у вас высшая мера наказания нерадивым студентам?..
 

Rezec

По пиву? (socket80)
А можно назвать конкретный раздел из мат статистики, который мне нужен?
 

lanka

Новичок
Открываем ссылку, смотрим.
Раздел называется Числовые характеристики случайных величин.
Так же рекомендую почитать про распределения случайных величин, тк без этого не будет понятно. Конкретнее, про равномерное и нормальное распределения.
 

Rezec

По пиву? (socket80)
Первый курс я уже давно забыл, поэтому предложу еще одну отсебятину.
На декартовых координатах по оси Y отложить среднее значение, а по X число голосов. Из точки 0,0 провести отрезки и найти их длину. Их длина и будет рейтинговым числом ;)
 

lanka

Новичок
Если рассматривать так, то ранее вы находили площадь прямоугольника. То, что вы будете находить сейчас - его диагональ. Площадь находится быстрее - одно умножение, для диагонали нужно два числа возводить в квадрат, и еще корень извлекать.

..А можно еще проволоку изогнуть в форме интеграла и вытянуть шляпу из лужи!..
 

Rezec

По пиву? (socket80)
Почитал сегодня ночью книгу по матстату(нашлась такая дома). Ничего не понял - где у меня в задаче ожидание, где отклонение. Полный бардак в голове. LANKA, если не сложно, приведи пример решения данной задачки. Какой это ряд, какого там Бернулли надо смотреть. Эхх.
 

lanka

Новичок
> если не сложно, приведи пример решения
> данной задачки.

1. Для каждой статьи есть некоторое множество оценок. В идеале каждая оценка выставляется пользователями с одинаковой вероятностью для любой статьи. То есть для множества статей средние оценки распределены равномерно.
Что из себя представляет функция распределения для равномерного распределния, читаем здесь:
http://www.nsu.ru/mmf/tvims/chernova/tv/lec/node28.html
(пример 26)

2. Математическое ожидание - это вообще говоря среднее значение случайной величины.
http://www.nsu.ru/mmf/tvims/chernova/tv/lec/node42.html#SECTION000111000000000000000
- здесь определения.
Для равномерного распределения мат. ожидание равно (b+a)/2, где b и a - гравницы интервала, в которых может находиться величина.
В вашем случае средние оценки могут колебаться от 1 до 5, значит
средняя_оценка = (5+1)/2 = 3

3. Дисперсия
http://www.nsu.ru/mmf/tvims/chernova/tv/lec/node44.html#SECTION000113000000000000000
- здесь определение.
Вам это, вообще говоря, для данной задачи не нужно :)

4. Что вы собственно делали: :)
- Брали некоторое среднее, не обязательно мат. ожидание
- Вычисляли отклонение конкретной средней величины от общей средней величины
- Для нахождения рейтинга вычисляли произведение отклонения на вес величины. В качестве веса бралось количество проголосовавших по данной статье.
Подробнее про веса, канонические веса и проч. (главное, не запутайтесь) можно почитать здесь:
http://www.physfac.bspu.secna.ru/books/mathstat/modules/stcanan.html#purpose
(примерно в середине статьи)

В общем все правильно и замечательно.
:)

PS Если я где-то запуталась в математике, меня можно, и даже нужно поправлять.
PPS Не пишите, пожалуйста, мой ник БОЛЬШИМИ буквами. Спасибо.
 

Rezec

По пиву? (socket80)
Ну вот, теперь рейтинг на нашем сайте доказан математически :) Спасибо.
 

lanka

Новичок
Да, вы так и не ответили, что есть в вашем понимании "вышка"?
 

lanka

Новичок
И как - успешно повесились?
(вот уж не думала, что мои выкладки похожи на комплект из мыла душистого и веревки пушистой...)
 

Rezec

По пиву? (socket80)
Самое инетересное, что решение задачи то простое - проще чем нахождение отрезка. А теорий, непонятных выражений и замудренных слов на целые книги. И Попробуй вытащить из этой кучи нужное ... млин
 

lanka

Новичок
"Замудренные" слова вовсе не замудренные - для того в институтах на них и натаскивают.
Просто все эти "умные" слова обычно подводят к гораздо более сложным задачам :)
К тому же если задача несложная, то к нужному результату можно придти эмпирическим путем - что вы и сделали.

PS Придираясь - а что вы имеете в виду под нахождением отрезка? Кто его терял? :)
Точность формулировок не бывает лишней нигде.
 
Сверху