WP
^_^
Лексический поиск по БД.
СУБД MySQL, таблица с индексом FULLTEXT (`title`, `body`). Нужно организовать поиск так чтобы учитывались разные приставки и окончания запрошенных слов. Хотел бы узнать как это реализовали другие, но без использования словаря (это обязательное условие). Мои соображения:
Непосредственно поиск делается в boolean mode. По небольшой базе приставок и окончаний (они хранятся в виде массива) выделяем корень слова, и ищем *корень*, а потом фильтруем результаты регулярным выражением.
Поиском пользовался, нашел Стеммер Поттера, он поможет с выделением корня =)
Спасибо.
-~{}~ 05.06.06 00:23:
Еще поискал, нашел решения со словарем, а хотелось бы без него
СУБД MySQL, таблица с индексом FULLTEXT (`title`, `body`). Нужно организовать поиск так чтобы учитывались разные приставки и окончания запрошенных слов. Хотел бы узнать как это реализовали другие, но без использования словаря (это обязательное условие). Мои соображения:
Непосредственно поиск делается в boolean mode. По небольшой базе приставок и окончаний (они хранятся в виде массива) выделяем корень слова, и ищем *корень*, а потом фильтруем результаты регулярным выражением.
Поиском пользовался, нашел Стеммер Поттера, он поможет с выделением корня =)
Спасибо.
-~{}~ 05.06.06 00:23:
Еще поискал, нашел решения со словарем, а хотелось бы без него


Выделяем значимую часть слова.