Жигaн
Продвинутый новичок
На форуме с: Mar 2006
Cообщений: 105
Город:
 |
2WP: Хмм даже не знаю, я старался сделать и так все по минимуму . А что имеется ввиду ппо 1 класс?
Сейчас phpMorphy класс - фасад к внутреннему API. Ты имеешь ввиду сделать все вызовы через фасад типа
$morphy =& new phpMorphy($opts);
$normal = $morphy->getNormalForm($word);
и т.п.? Или упростить внутренний API? Дык кудаж меньше? 
Просто сейчас возможно гибко управлять внутренностями, кэширование и т.п., если упростить то саппортить код будет невозможно.
2Wicked:
Спасибо, насчет венды забыл , правда неясно почему при установки локали ru_RU будет выбрана 1251 кодовая страница? интересно взглянуть на результат locale -a|grep ru_RU . Теперь насчет скорости. 700 слов это при каких настройках(предсказание, fsa_cache_* и т.п.)
Расскажу свое ИМХО как потюнить скорость:
in_memory -- следует включать ТОЛЬКО при пакетной обработке текстов большого объема(это я думаю и так понятно)
graminfo_cache -- я включаю всегда
fsa_cache_levels -- включаю ТОЛЬКО при пакетной обработке, причем если объем текста
fsa_cache_dir -- это можно установить всегда(будет использовано если fsa_cache_levels>0)
with_gramtab -- просто так лучше не включать т.к. в этом случае при каждом запросе будет читаться файл gramtab.rus.bin(30кил +unserialize). Для поиска эти данные скорее всего не понадобятся.
predict_by_suffix -- если нужно предсказание
predict_by_db -- если нужно предсказание
По предсказанию:
Включать можно только predict_by_db(предсказание по окончанию) т.к. в основном работает именно оно. predict_by_suffix работает для слов типа 'мегачерный' т.е. к нормальному слову была приписана приставка.
2All: Нужны кому english, german словари, или достаточно русского?
-~{}~ 28.02.07 22:26:
2Wicked: Вы делали морфологию на основе ispell в mysql? Интересно какая скорость нормализации?
|