Особенное слово поиска

KapriS

Новичок
Приветствую, форумчане.
Вопрос в следующем. На сайте прикручен спайдер поисковик. Хорошо работает, но заметил клиент, что у него не ищутся два значения: КПД КПД-3В.
проверила все возможные варианты - прочие абревиатуры находятся, прочие слова из этих документов находятся, задавала в англ, русском режиме, в нижнем и верхнем регистре кпд - не ищет. Добавляла КПД в другие документы, на другие страницы - все равно не ищет. делала полную переиндексацию сайта - тоже не помогло.
Слово -запрос по ходу выполнения не теряется, на страницу результата поиска выводится: "вы искали: кпд. результатов нет."
Какие еще будут предложения определить причину не поиска. помогите советом и какими-нить соображениями. моя фантазия истощена :(
 

A1x

Новичок
фантазия это последнее что здесь нужно - надо брать и смотреть конкретный код
 

sobachnik

Новичок
Может быть это слово встречается слишком часто и MySQL посчитал его не имеющим смысл мусором?
 

A1x

Новичок
sobachnik вроде там нигде не сказано что поиск работает на MySQL

KapriS
кстати посмотрите не включено ли это слово в какой-то стоп лист
 

Mr_Max

Первый класс. Зимние каникулы ^_^
Команда форума
Не удивительно, что не находит.

Если речь идет, о мускуле (что как-бы считается здесь по-умолчанию, если не указано точно), то дефолтное значение длинны слова установлено в 4 символа.

mysql> show variables Like '%min_w%';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| ft_min_word_len | 4 |
 

KapriS

Новичок
фантазия это последнее что здесь нужно - надо брать и смотреть конкретный код
Очень дельное замечание. Но мне это не помогло. Знаний не хватает для более детального анализа кода готового поисковика.
 

KapriS

Новичок
Может быть это слово встречается слишком часто и MySQL посчитал его не имеющим смысл мусором?
Мусором считается то, что заключено в комменты "no index", часть кода с искомыми словами не входит в рамки неиндексируемого текста
 

KapriS

Новичок
Не удивительно, что не находит.

Если речь идет, о мускуле (что как-бы считается здесь по-умолчанию, если не указано точно), то дефолтное значение длинны слова установлено в 4 символа.

mysql> show variables Like '%min_w%';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| ft_min_word_len | 4 |
Во-первых КПД-3В - это уже не 4 символа, а во-вторых по запросу "гла" - были выведены страницы с упоминанием "ГЛАВНАЯ".
 

KapriS

Новичок
KapriS
кстати посмотрите не включено ли это слово в какой-то стоп лист[/quote]
Подскажите, где может находиться этот стоп лист. Ничего не знаю про него...
 

KapriS

Новичок
Не удивительно, что не находит.

Если речь идет, о мускуле (что как-бы считается здесь по-умолчанию, если не указано точно), то дефолтное значение длинны слова установлено в 4 символа.

mysql> show variables Like '%min_w%';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| ft_min_word_len | 4 |
но все же пойду проверю
 

Mr_Max

Первый класс. Зимние каникулы ^_^
Команда форума
Во-первых КПД-3В - это уже не 4 символа, а во-вторых по запросу "гла" - были выведены страницы с упоминанием "ГЛАВНАЯ".
Во-первых, все входные задачи данные у тебя.
Ты дала нам некий черный ящик, тебе подсказывают, насколько это возможно, в чем может быть причина.
Во-вторых. Почему, до сих пор, если у тебя проблема с запросом, ты не удосужилась этот запрос вставить в форум?
 

sobachnik

Новичок
Мусором считается то, что заключено в комменты "no index", часть кода с искомыми словами не входит в рамки неиндексируемого текста
Если там MATCH ... AGAINST - то мусором считается любое часто повторяющееся слово. Частота повторов, достаточная для того, чтобы б.д. посчитала его мусором - на сколько помню, это в настройках регулируется.
Каждое правильное слово в наборе проверяемых текстов и в данном запросе оценивается в соответствии с его важностью в этом запросе или наборе текстов. Таким образом, слово, присутствующее во многих документах, будет иметь меньший вес (и даже, возможно, нулевой), как имеющее более низкое смысловое значение в данном конкретном наборе текстов. С другой стороны, редко встречающееся слово получит более высокий вес. Затем полученные значения весов слов объединяются для вычисления релевантности данной строки столбца.

Код:
mysql> SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('MySQL');
Empty set (0.00 sec)
Поиск по слову "MySQL'' в предыдущем примере не приводит к каким-либо результатам, так как это слово присутствует более чем в половине строк. По существу, данное слово целесообразно трактовать как стоп-слово (т.е. слово с нулевой смысловой ценностью). Это наиболее приемлемое решение - запрос на естественном языке не должен возвращать каждую вторую строку из таблицы размером 1Гб.
 

KapriS

Новичок
KapriS
как ты ищешь???? поисковой движок???
ДА!!!
ЗА отсутствием опыта не смогла объяснить конкретнее. Думала фразы "На сайте прикручен спайдер поисковик" - будет достаточно для понимания сути вопроса. Простите, форумчане за путаницу. Может начнем сначала.
Так вот готовый движок что-то ищет что-то нет. не могу найти причину.
 

Mr_Max

Первый класс. Зимние каникулы ^_^
Команда форума
- Петька, приборы!
- 200!
- А почему 200!
- А почему приборы!
 

SkyLine

Новичок
Так вот готовый движок что-то ищет что-то нет. не могу найти причину..
Так вот причина в нем. В нем и нужно искать. Причин может быть множество. Или искать в коде ошибки (неточности) или брать другой (писать свой) движок, который будет искать все, что надо и как надо.
 

baev

‹°°¬•
Команда форума
KapriS, к авторам «спайдера» обращались? Нет? Почему?
 
Сверху