Меня, в общем, интересовали, готовые решения... как писать свой замут, и какие направления имеет смысл разрабатывать, в общем-то, понятно...
а есть, интересно, базы "полуфабрикатов", например, корней русских слов, приставок, суффиксов, и так далее?
моя задача, например, не совсем поиск. Важно идентифицировать разные склонения как одно и то же слово. Вроде по сканам Железняка (а также по его онлайновым имплементациям) можно предположить, что он позволит выделять основу более эффективно, чем ispell
Кстати, кто-то знает, что за словарь Книжника такой? Основной файл там выглядит примерно так:
0юан
3ей
3ь
1балхо
2ер
4а/E
4ляден/K
2илаумшахт
4ее
6м
6в
5и/F
5й
6ная/C
7ом/A
6чик
4яра/E
2ка/E
3и
3ой
2ок
3чек
4ке
5и/
а подобия аффиксного файла я как-то не нашел.
Кто знает, что за формат такой?