Занимается ли здесь кто моделированием?

PartizaneN

I speak PHP
Занимается ли здесь кто моделированием?

Применяет ли кто мат-методы для, например, прогнозирования. Строил ли кто трендовые (и не только) модели для прогнозирования посещаемости, нагрузки сервера и т.п.

Давайте вобщем поговорим.
 

[DAN]

Старожил PHPClub
Отчего же не поговорить. Что-что, а это мы умеем =)
Вообще, эта область моделирования весьма сингулярна, ибо зависит от большого множества факторов (имхо). Лично я не знаю ни одной модели для анализа тех или иных факторов интернет-системы.
Как минимум, придется выводить эмпирически обоснованные системы (модели), собирать статистику, производить псевдоэмперические данные (метод статистических испытаний), и далее по итерации :)

Лучше задаться вопросом поконкретнее.
 

neko

tеam neko
> Лучше задаться вопросом поконкретнее.
как мне зароботать бабок на в интернете?????
 

PartizaneN

I speak PHP
2 [Dan] Полиномы решают :) шутка.

Вообще любые результаты нужно оценивать эмпирически.

Мне кажется, что все-таки, наоборот, очень даже неплохо можно замоделировать тот или иной интернет процесс. Т.к. стат данных просто навалом.

>Лучше задаться вопросом поконкретнее.

Вот я задался вопросом моделирования посещаемости с целью прогнозирования.
И что я думаю:
2-х факторная модель:
И вот какие 2 явных фактора мне сейчас на ум пришли :) Посетители пришедшие по ссылкам и остальные посетители... Ну и не забыть про сезонность само-собой. (ну пн-вс).

трендовая модель:
Просто тупо взять, например, полиномы Чебышева.

>>как мне зароботать бабок на в интернете?????
уууу...
 

Demiurg

Guest
PartizaneN
и что делать с полиномами Чебышева, после того, как их взяли ?
 

PartizaneN

I speak PHP
:)

-~{}~ 05.06.05 23:07:

Хм...

Раз тема замерла - напишу, что же такое полиномы...

Есть дискретные и тригонометрические полиномы чебышева...

Дискретные - раскладываются на основе простого ряда чисел, например, от 1 до 12... Раскладывается 11 порядков таких полиновов и после этого с помощью МНК составляется паспорт модели.... Результативным показателем берем то, что хотим спрогнозировать, а факторы - матрица разложенных полиномов 12 на 11 :) ... Кароче найдем уравнение, которое лучше всего описывает динамику наших результативных показателей..... и на основе него и прогнозируем... Причем берем лишь 3 самых значимых фактора....

Тригонометрические - те же яйца только в профиль... :) Вместо чисел от одного до 12 берем градусы, находим радианы, и потом косинусы и синусы... и т.д.

Кароче спрогнозировал я... только не так как выше описал, а по другому и получил уравнение y=(a-bx)/(1-b).
у - посетители в день...
х - ожидаемый приток челов по ссылкам...
 

[DAN]

Старожил PHPClub
PartizaneN, чушь!
Предметная область не допускает отрицательного значения функции (посетителей).
Да и вообще, все, что ты тут написал - полный бред пьяного студента.
 

Alexandre

PHPПенсионер
Ну и не забыть про сезонность само-собой. (ну пн-вс).
ну еще время года (зима-весна-лето-осень)
время суток ( день - вечер - ночь - утро )

1) статистическое моделирование, метод оценки гипотез
2) кластерный или многофакторный анализ

во первых факторов гораздо больше, чем тебе кажется
во вторых - все не атк просто, как ты делаешь.
 

PartizaneN

I speak PHP
2Dan Да... соврал... y=(a+bx)/b-1 Коэф детерминации 0,98...
напомню... х-пос. пришедшие по ссылам.

Но это лишь для определенного сайта.... Насчет полиномов - попросили - написал.. :) ...

2 Alexandre - согласен факторов побольше будет...

Сезонность как оказалось и не сильно то и нужно учитывать... Например, прогнозируя на месяц вперед - не очень-то и хочется учитывать пн-вс.

А вот спрогнозировать прирост посетителей, пришедших по ссылкам вполне можно полиномами, либо разделить трафик на поисковый и остальной. Затем уже отдельно их анализировать...

Вот что меня интересует... Будет ли это нормальным привязать рост постоянных посетителей к количеству, пришедших по ссылам. Навскидку прикинул
PHP:
Новые	рассчет прибавки

60	0
60	1
60	3
60	6
60	9
60	12
60	14
	17
	18
	18
	17
	16
	14
	13
	12
	10
	9
Взял от балды формулу, рассчитывающую подобное влияние.

0,0232*0,8*(люди, пришедшие по ссылам за 4 последние дня)*0,4*(народ, приш. за 5-7 от рассчитываемого дня)*0,2*(8-14)*0,07*(15-30)

0,0232 - это процент, который показывает сколько народу в среднем возвращается.

+ я еще приплюсовываю то, что из этих 0,0232 - посетителей, особенно заинтересовавшихся (ну т.к. вернулись все таки на сайт), 75% еще позже зайдет...

Надеюсь не слишком замудрил...

Вобщем все эти коэфициенты 0,8 0,4 и т.п. нужно заменить на реальные, которые наверняка можно найти, только как?
 

Alexandre

PHPПенсионер
PartizaneN
еще учитывай - рекламные компании в инете:
- рассылка рег. юзерам,
- размещение банеров
дают доп прирост посещаемости.

это тоже немаловажный фактор, который необходим для прогнозирования
 

[DAN]

Старожил PHPClub
PartizaneN, изучай марковские процессы, моделируй марковские цепи, получай оттуда коэфициенты.
При хорошем раскладе неплохой диплом для прикладного математика получится.
Эмперику можно брать с поисковых серверов.
 

PartizaneN

I speak PHP
Alexandre, для того, чтобы это учитывать - нужно еще дополнительно статистику вести когда и что сайт рассылал.

В принципе тем, что я выше описал можно оценить ведение какой-нибудь рекламной компании, привязать все к затратам и прибыли. Как всегда все упирается в самое главное - методику. Чтобы подкорректировать все коэфициенты придется проанализировать несколько рекламных компаний, отсекая обычный трафик и его влияние на увеличение посещаемости... И большой вопрос, подойдут ли полученные коэфициенты для другого сайта...

2[Dan] А пробовал ли ты прогнозировать в инете чего-нибудь?
 

[DAN]

Старожил PHPClub
PartizaneN, в интернете нет, но в ядерной физике - да. Лет пять наверное "прогнозированием" занимался...
Изучай предметную область, выявляй ключевые факторы.
Выдвигай гипотезу H0 и альтернативные. С помощью методов мат. статистики выявляй состоятельность гипотез, кореллируй отношения между факторами, отбрасывай несущественные факторы и т.д.
На каком-то этапе итерации получишь приблизительную модель того, что хочешь смоделировать.
Дальше - проще.
 
Сверху