Анализ плотности ключевых слов на странице. Алгоритм

dirol

Новичок
Анализ плотности ключевых слов на странице. Алгоритм

Здравствуйте!
Подскажите, пожалуйста, алгоритм расчета плотности ключевых слов на странице.
В кратце, что это такое...
Анализ плотности - грубо говоря, как часто слово или словосочетание встречается на странице.

Например текст:
"Покупайте цветы только у нас. Самые лучшие цветы"
Всего слов: 7 (берем слова >= 3)
Слово "цветы" встречается 2 раза, значит плотность это слова 28%

Со словами все понятно.
А как быть со словосочетаниями, например,
"Покупайте лучшие цветы только у нас. Самые лучшие цветы"
Как просчитать какое(-ие) словосочетание (-я) встречаются чаще.

пример On-line скрипта: http://www.seoexp.com/ru/seo_tools/page_analyzer/
 

Beavis

Banned
dirol
взять текст, разбить на слова, и посчитать их плотность...
только слова могут быть в разных формах записаны(
 

dirol

Новичок
Beavis
Ваш вариант подходит только в том случае, если необходимо проанализировать плотность одного ключевого слова, это уже сделано!
А задача состоит в том, чтобы проанализировать какие словосочетания (из 2х или более слов) встречаются чаще всего...
 

rotoZOOM

ACM maniac
dirol а что понимается под словосочетанием ? Любые 2 или более слов, стоящие рядом и не разделенные знаками пунктуации ?
 

Farsh

~ on ~ high ~ wave ~
Вообще , все что здесь нужно , это mystem и куча циклов :)
 
Сверху