Welcome to PHPClub
Переходим на PHP 5.3.3! Ищем хорошего PHP-разработчика Москва,
офис ~90-150К
Боишься нашего дизайна?
поиск:
   
 Начало | Настройки | Расширенный поиск | РегистрацияПосмотреть новые сообщения 
  
PHP Club форумы: > Разное > PHPWorld - новости из мира PHP > Русская морфология
Страниц (16): « Первая ... « 13 14 15 [16] |  

Автор
Тема ОТВЕТИТЬ
leptosomic
Новичок

На форуме с: Jul 2010
Cообщений: 2
Город:

скажите, существует ли возможность получить словоформы, образующиеся с помощью добавления приставок и окончаний? например, "бить-прибить-подбить-биться"?

Old Post 04.07.10 07:55 URL сообщения | инфо об авторе | жалоба | IP: Записан | редактировать | ОТВЕТИТЬ и ЦИТИРОВАТЬ
Жигaн
Продвинутый новичок

На форуме с: Mar 2006
Cообщений: 105
Город:

leptosomic
Я так пониманию, что нужно словообразование. Только непонятно что конкретно нужно.

Old Post 04.07.10 22:42 URL сообщения | инфо об авторе | жалоба | IP: Записан | редактировать | ОТВЕТИТЬ и ЦИТИРОВАТЬ
leptosomic
Новичок

На форуме с: Jul 2010
Cообщений: 2
Город:

Жигaн
Вообще, хотел сделать поиск с учетом морфологии. Скажем, в запросе присутствует слово "матрос". Получаем все словоформы, и ищем их в тексте. И "матросика" не находим, хотя по идее должны. То же самое с "купить-прикупить". Думается примерно так: вводят слово "прикупить", определяем, что это слово "купить" с приставкой, потом по очереди прибавляем все возможные приставки к "купить", и все полученные слова ищем в тексте. Можно это сделать хотя бы теоретически на этом словаре?

Old Post 05.07.10 08:40 URL сообщения | инфо об авторе | жалоба | IP: Записан | редактировать | ОТВЕТИТЬ и ЦИТИРОВАТЬ
Жигaн
Продвинутый новичок

На форуме с: Mar 2006
Cообщений: 105
Город:

leptosomic
 
Скажем, в запросе присутствует слово "матрос". Получаем все словоформы, и ищем их в тексте. И "матросика" не находим, хотя по идее должны.


Вообще лучше так не делать. Смысл повышать полноту в ущерб релевантности?

 

Можно это сделать хотя бы теоретически на этом словаре?


Если только на самом простейшем уровне. Дело в том, что в словаре словоформы не разделяются на морфы, вместо этого используется упрощенная модель типа "префикс+основа+окончание". Причем основа выделяется как lcs для словоформ в парадигме.

Old Post 06.07.10 16:16 URL сообщения | инфо об авторе | жалоба | IP: Записан | редактировать | ОТВЕТИТЬ и ЦИТИРОВАТЬ
akaplenko
Новичок

На форуме с: May 2009
Cообщений: 2
Город:

У меня не получается скачать ispell словарь. Говорит что архив битый. Не поможете?

Old Post 08.07.10 21:17 URL сообщения | инфо об авторе | жалоба | IP: Записан | редактировать | ОТВЕТИТЬ и ЦИТИРОВАТЬ
Жигaн
Продвинутый новичок

На форуме с: Mar 2006
Cообщений: 105
Город:

перезалил. сейчас должно быть всё в порядке.

Old Post 09.07.10 01:38 URL сообщения | инфо об авторе | жалоба | IP: Записан | редактировать | ОТВЕТИТЬ и ЦИТИРОВАТЬ
akaplenko
Новичок

На форуме с: May 2009
Cообщений: 2
Город:

 
Автор оригинала: Жигaн
перезалил. сейчас должно быть всё в порядке.


Большое вам спасибо, теперь скачивается :-)

Old Post 09.07.10 14:58 URL сообщения | инфо об авторе | жалоба | IP: Записан | редактировать | ОТВЕТИТЬ и ЦИТИРОВАТЬ
Время GMT. Текущее время 22:51. Подписаться на Тему | Версия для Печати
Страниц (16): « Первая ... « 13 14 15 [16] |  

PHP Club форумы: > Разное > PHPWorld - новости из мира PHP > Русская морфология
 
Оценить:
 
 
 
 

 © 1997-2010 PHPClubTeam      

Powered by vBulletin Copyright © 2000-2010 Jelsoft Enterprises Limited.