Словари синонимов, морфемный анализ и.т.д

iii

Guest
Словари синонимов, морфемный анализ и.т.д

Вопрос:
Существуют ли для ПХП какие нибудь лингвистические библиотеки? Ну там выделение корня, приставки, окончания.
Ну или может быть существуют хотя бы free-шные Базы данных по синонимам, антонимам и т.д ит.п к которым из ПХП подключиться можно?
Если у кого есть ссылки на такой материал, кинте пожалуйста.
 

[VS]

Guest
Re: Словари синонимов, морфемный анализ и.т.д

Автор оригинала: iii
Вопрос:
Существуют ли для ПХП какие нибудь лингвистические библиотеки? Ну там выделение корня, приставки, окончания.
Ну или может быть существуют хотя бы free-шные Базы данных по синонимам, антонимам и т.д ит.п к которым из ПХП подключиться можно?
Если у кого есть ссылки на такой материал, кинте пожалуйста.
На PHP это будет тормозить дико. Плавали, знаем. Нужны большие библиотеки с корнями, и.т.д. эти библиотеки будут на PHP обрабатываться очень и очень долго. Советую обратить внимание на то что нет поисковых движков на PHP. По той-же причине кстати.
 

iii

Guest
Re: Re: Словари синонимов, морфемный анализ и.т.д

Автор оригинала: [VS]
На PHP это будет тормозить дико. Плавали, знаем. Нужны большие библиотеки с корнями, и.т.д. эти библиотеки будут на PHP обрабатываться очень и очень долго. Советую обратить внимание на то что нет поисковых движков на PHP. По той-же причине кстати.
Прошу прощения за Оффтопик, а на чем это все делается обычно?
Если ты с этим уже работал, может можешь подсказать где эти самые библиотеки с корнями взять?:confused:
 

[VS]

Guest
Re: Re: Re: Словари синонимов, морфемный анализ и.т.д

Автор оригинала: iii
Прошу прощения за Оффтопик, а на чем это все делается обычно?
Если ты с этим уже работал, может можешь подсказать где эти самые библиотеки с корнями взять?:confused:
Делается на C/C++. Где библиотеки взять - не знаю. Я года полтора назад наивно хотел написать поисковый движок (по всем правилам, с индексацией, и.т.д.) на PHP. 2 недели сидел и писал. Получалось круто. Делал сам грубый морфологический анализ, и.т.д. В общем 1Ghz компьютере поиск по индексам одной страницы из ста занимал примерно секунду. Естественно такая скорость для реальной задачи вообще не применима. Поэтому люди и используют mnogosearch, и.т.д.
 

andry

Новичок
ispell

Попробуй ispell поковырять, у нас получилось.
Можно самому афиксные файлы обрабатывать.
 

iii

Guest
Re: ispell

Автор оригинала: andry
Попробуй ispell поковырять, у нас получилось.
Можно самому афиксные файлы обрабатывать.
Расскажи подробнее,пожалуйста.
Словарь аффиксов вытащить из испелла - непроблема, а вот можно ли вытащить оттуда корни?
Или он их не хранит?
Проблема в том, что логическая часть у испелла написана на LISPе а я в нем не силен ж(((((((
 

iii

Guest
Re: Re: Re: Re: Словари синонимов, морфемный анализ и.т.д

Автор оригинала: [VS]
Делается на C/C++. Где библиотеки взять - не знаю. Я года полтора назад наивно хотел написать поисковый движок (по всем правилам, с индексацией, и.т.д.) на PHP. 2 недели сидел и писал. Получалось круто. Делал сам грубый морфологический анализ, и.т.д. В общем 1Ghz компьютере поиск по индексам одной страницы из ста занимал примерно секунду. Естественно такая скорость для реальной задачи вообще не применима. Поэтому люди и используют mnogosearch, и.т.д.
А может тебе не жалко кинуть эти исходники мне?
А то вот у меня диплом горит.
Даже если они совсем сырые, я с удовольствием в них покопаюсь.
 
Сверху