Жигaн
Новичок
Русская морфология
Доброго времени суток.
Выложил библиотеку для проведения морфологического анализа в public domain. Надеюсь некоторым будет интересно взглянуть
.
features
В качестве основы был взят проект AOT, в частности словари и алгоритм предсказания были взяты из него.
Homepage: phpMorphy
Demo: phpMorphy - Demo
Документации пока нет(ибо опенсурс
), но есть example.php в дистрибе
. Будут вопросы\пожелания задавайте!
Благодарю за внимание.![Wink ;) ;)](/talk/styles/default/xenforo/smilies/wink.png)
Доброго времени суток.
Выложил библиотеку для проведения морфологического анализа в public domain. Надеюсь некоторым будет интересно взглянуть
![Wink ;) ;)](/talk/styles/default/xenforo/smilies/wink.png)
features
- Для входного слова умеет находить:
- --- Псевдо корень
- --- Нормальную форму
- --- Все словоформы
- --- Грамматическую(и не только
) информацию
- Скорость нахождения нормальной формы ~700 слов в секунду(это для php5.1.1, WinXP, Duron-800), имеется возможность загрузить словарь в память, при этом скорость возрастает примерно на 20-25%.
- Основной словарь содержит около 3млн словоформ
- Есть два режима предсказания ненайденных слов – по суффиксу и по специально подготовленному словарю(подробнее см. http://www.aot.ru/docs/sokirko/Dialog2004.htm, я реализовывал этот алгоритм). Качество предсказания -- так себе…
- Размер словаря ~4Mb
- Для работы необходим php4.3.x, php5(пробовал php4.3.7 и php5.1.1)
- Лицензия LGPL
В качестве основы был взят проект AOT, в частности словари и алгоритм предсказания были взяты из него.
Homepage: phpMorphy
Demo: phpMorphy - Demo
Документации пока нет(ибо опенсурс
![Wink ;) ;)](/talk/styles/default/xenforo/smilies/wink.png)
![Wink ;) ;)](/talk/styles/default/xenforo/smilies/wink.png)
Благодарю за внимание.
![Wink ;) ;)](/talk/styles/default/xenforo/smilies/wink.png)