Плотность слов и фраз

Статус
В этой теме нельзя размещать новые ответы.

twistfire

Новичок
Плотность слов и фраз

Доброго времени суток.
Может кому-то приходилось сталкиваться...
есть достаточно большого объема текстовые файлы.
до 1 Мб..

Пользователь вводит кючевую фразу для поиска по файлу.
Как оченить плотность слова? Плотность фразы в тексте?
Как посчитать?
 

twistfire

Новичок
плотность фразы = отношение количества вхождений фразы в файе к количеству слов в файле.
Как найти коичество вхождений фразы/слова?
 

tf

крылья рулят
Как найти коичество вхождений фразы/слова?
будет смешно, но
= отношение количества вхождений фразы в файе к количеству слов в файле.
тебе алгорим искать надо, нормальный

-~{}~ 05.04.07 22:12:

а что мы делаем и для чего можеш сказать?
 

twistfire

Новичок
я считаю плотность слов или фраз для своего инструмента - анализ выдачи поисковиков.

Мне там нужно считать плотность слова (фразы) на странице, как один из факторов в формуле.

Вот я и пытаюсь.
Определяю количество слов, формирую массив состоящий только из слов.
Далее считаю вхождение слова в массив..
Здесь все просто..

А как быть с фразами???
Как посчитать количество вхождений фразы??
 

Angerslave

Новичок
Ну как... for'ом смотришь каждый элемент массива вплоть до (количество_слов_в_тексте - кол-во_слов_в_фразе) слов текста. Если он(элемент массива слов текта) совпадает с первым словом фразы - смотришь следующий элемент и второе слово фразы.. И т.д. Копай в сторону рекурсии или цикла for. Если фраза совпала - ок, ставишь каунтеру +1. И так далее.
 

Румата

Новичок
twistfire
1.Если в файле фраза состоит из слов А Б В Г, а пользователь ввел А Б Г, то это считается за совпадение или нет?

2.А как Вы считаете частоту слов?
 

twistfire

Новичок
нет не считается совпадением...

а частоту слов считаю так - мколько раз слово попалось в тексте, - потом делю на общее количество слов в тексте..

В целом уже все понятно.
закрыта тема
 
Статус
В этой теме нельзя размещать новые ответы.
Сверху