отвечая сразу на все три предыдущих поста.
я не утверждаю, что морфология - это наше всё. дело в том, что тред-то начался вообще с preg_match, если не ошибаюсь. ну ладно, давайте посмотрим с другой стороны. хорошо, пусть главное - некий мистический движок, о котором вы говорите. тогда я не совсем врубаюсь, что такого действительно необычного и интересного в движке, который без морфологии, без ранжирования? а ранжирование вообще отдельный разговор, очень больная тема (даже для Рамблера, например). когда-то давно я поковырялся в коде многосерча, так вот, если грубо, то мы имеем: правила образования словоформ, сам словарь, несложную но удобную архитектуру хранения данных и api к этому безобразию. если приложить это к mysql, то действительно основного кода(api)- "ядра" если хотите - вот это будет _максимум_ тысяча строк - и на индексирование, и на поиск. и это и с морфологией, и с ранжированием (пусть и возможно достаточно убогим ранжированием сточки зрения "больших" коммерческих поисковых систем). если отсюда выкинуть эти фичи - что там останется? и вот я пытаюсь понять, что тогда вы имеете ввиду под движком. ну пускай есть библиотека функций, которые:
- бьют входной текст на слова и кладут их куда-то в базу или как ещё со своми весами с привязкой к некоторой сущности, полностью описывающей нужный документ
- по набору входных слов поискового запроса ищут точные совпадения и выдают результаты
это - движок? это пара сотен строк кода, имхо, это не движок.
что же я забыл? или всё-таки это - "движок"?