Индексатор HTTP-ресурсов, Поисковик

Yuriy_S

-=PHP-Club=-
Индексатор HTTP-ресурсов, Поисковик

Добрый день!


Ищу сабж. MnogoSearch не предлагать.
Максимальные достаточные требование: индексирование HTTP-ресурсов сети, поиск по базе проиндексированных ресурсов.
Готов купить в любой момент.

Приветствуются ссылки и т.п.
 

Yuriy_S

-=PHP-Club=-
Требования к СУБД: MySQL || PostgreSQL.
Требования к поиску: простой поиск по базе данных (по данным, извлеченным из метатегов, контента и т.п.).
Создание каких-либо словарей.

Индексатор:
да, программа, выполняющая индексирование ресурсов (список ресурсов определен, хранится в БД) в определенный промежуток времени в соответствии с параметрами конфигурации. Система расчитана на небольшое количество ресурсов (1000-2000). Поэтому индексирование достаточно производить в один поток.

Все, что касается WEB-интерфейса - предпочтительно PHP-программы. Индексатор - желательно Perl or C or C++ (т.к. он должен работать как демон).

-~{}~ 26.05.05 15:41:

неужели нет уже готовых решений... не верю.
 

Kelkos

Сам себе программер
Есть.. Пиши на [email protected] покажу законченный на 90%
Система создавалась как доп. сервис к сайтам клиентов (поиск по сайту).
Не сделанно оформление пользовательской части. (сейчас срочно пускаем другой сервис, а этот отложили на начало июня, хотя осталось только нарисовать и разверстать дизайн, ну и красиво оформить пользовательскую часть).
В данный момент уже работоспособны индексирующий бот, формы регистрации, система управления индекскцией, модуль поиска (пока только 1 алгоритм поиска FULLTEXT %) ), сервисы выдачи результата и статистика пользовательских запросов
Индексирующий бот применяет механизм объединения одинаковых страниц, что достаточно экономит размеры базы.
Да вообщем, там много всего.. описалова на несколько страниц. Если ещё никто не предложил ничего достойного пишите, завтра покажу демку с парой десятков проиндексированных сайтов.
 
Сверху