Морфология

Silent

Новичок
Нужно обрабатывать вручную. За несколько месяцев вполне реально. Поэтому делать это только для себя нет никакого смысла, проще купить.
 

young

Новичок
Господа, а может кто-нибудь напишет статейку по этой теме?будет очень полезно. А материала я так вижу достаточно.
И предлагаю тему в избранное.
 

Falc

Новичок
Silent
>>Поэтому делать это только для себя нет никакого смысла, проще купить.
Проще на лебедевском словаре сделать, с вероятностью 99% пользователь не заметит разницы. Да и потом морфология не главное в поиске.
 

Falc

Новичок
clevel
Поясни что за ссылка?
А то качать exe'шники с сомнительных сайтов не в моем стиле.
 

clevel

Новичок
ты по ссылкам пойди, почитай о программе Ариадна 2, сам сейчас читаю...
Ах, зачем Вы затронули мою мозоль... Я год назад поставил себя словарь от ispell и успокоился -- мол работает морфология...
Ан нет! Сейчас опять надо генерить это словари...
Давайте объединимся... и найдем, доработаем нужный нам вариант, ок?
 

Silent

Новичок
Ариадну я смотрел. Очень неплохо для начала, но есть свои проблемы: есть ошибки, неполные парадигмы, то есть нужно дорабатывать. Можно конечно оставить и как есть, но и будет это примерно как словарь от ispell, или чуть лучше. В какой-то момент все равно придется остановиться, если писать для себя. Кроме того, словарь Зализняка уже устарел, там много старых слов, которые можно безболезненно выбросить, и нет современных слов. Поэтому Коваленко и просит за свой анализатор 2000$, ведь там не только хороший алгоритм и словарь Зализняка, но и несколько лет чистки и пополнения этого словаря.
 

Falc

Новичок
Silent
Я понял что если нет желания погрузится в морфологию на ближайшие несколько месяцев, до дальше ispell'а двигаться не стоит.
 

clevel

Новичок
или а Silent обращаться с 50 долларами для словарика по морфологии...
 

saper

Guest
У меня есть морфологический словарь15 тысяч слов
имеются словоформы и окнончания в разном времени, кроме этого могу сразу парочку алгоритмов дать для создания естественно языковой системы общения с БД. Алгоритм работы Морфологического анализатора. Делал всё для себя, но не на PHP.
 

rudik

Developer
saper
Если ты готов им поделиться, то все будут только рады.

-~{}~ 07.04.04 08:18:

Мой e-mail приймет словарь с удовольствием, на любом языке.
 

Falc

Новичок
saper
>>словарь15 тысяч слов
Маловато слов у тебя.
В русском языке вроде порядка 100 тысяч нормальных форм.

У меня к примеру функция возвращает нормальную форму от одного слова за 0,5 мсек(WinXP Athlon 2200+). Все кстати сделано на ПЫХе и мускуле :)
 

saper

Guest
Выложить да без проблем, только где? И в каком формате давать MSSQL, mdb или MYSQL. А насчёт количества, это правильно подмечено, БД учебная, профессиональные они денег стоят, но на этой можно поэксперементировать.
 

saper

Guest
Куда вылаживать? Говорите, а то всем надо и молчат. Интересно.
 
Сверху