Жигaн
Новичок
Русская морфология
Доброго времени суток.
Выложил библиотеку для проведения морфологического анализа в public domain. Надеюсь некоторым будет интересно взглянуть .
features
В качестве основы был взят проект AOT, в частности словари и алгоритм предсказания были взяты из него.
Homepage: phpMorphy
Demo: phpMorphy - Demo
Документации пока нет(ибо опенсурс ), но есть example.php в дистрибе . Будут вопросы\пожелания задавайте!
Благодарю за внимание.
Доброго времени суток.
Выложил библиотеку для проведения морфологического анализа в public domain. Надеюсь некоторым будет интересно взглянуть .
features
- Для входного слова умеет находить:
- --- Псевдо корень
- --- Нормальную форму
- --- Все словоформы
- --- Грамматическую(и не только ) информацию
- Скорость нахождения нормальной формы ~700 слов в секунду(это для php5.1.1, WinXP, Duron-800), имеется возможность загрузить словарь в память, при этом скорость возрастает примерно на 20-25%.
- Основной словарь содержит около 3млн словоформ
- Есть два режима предсказания ненайденных слов – по суффиксу и по специально подготовленному словарю(подробнее см. http://www.aot.ru/docs/sokirko/Dialog2004.htm, я реализовывал этот алгоритм). Качество предсказания -- так себе…
- Размер словаря ~4Mb
- Для работы необходим php4.3.x, php5(пробовал php4.3.7 и php5.1.1)
- Лицензия LGPL
В качестве основы был взят проект AOT, в частности словари и алгоритм предсказания были взяты из него.
Homepage: phpMorphy
Demo: phpMorphy - Demo
Документации пока нет(ибо опенсурс ), но есть example.php в дистрибе . Будут вопросы\пожелания задавайте!
Благодарю за внимание.