поиск Адреса в тексте

Роберт

Аналитик
поиск Адреса в тексте

Может кто-нибудь поделится идеями - как можно найти статьи содержащие определённый адрес (улица дом квартира) среди гигобайтов текстовых статей? Сейчас статьи стоят в MySQL'e и если что-то надо в них найти - то ищется через полнотекстовый поиск. Но с адресами такое не выйдет , так как номер дома и квартиры не индексируется (поскольку меньше четырёх символов) , да и если бы индексировался - то выдавал бы не правильный результат , так как релевантность поиска в нём зависит больше от количества совпадений нежели от близости и порядка следования фрагментов поисковой информации. Так что сейчас , в случае необходимости найти адрес - использую регулярные выражения , что само собой разумеется , работает катастрофически медленно.
А так приятно посмотреть как это получается у Яндекса - ввёл строку - Гоголя 12 24 , и почти каждая вторая запись - именно то что надо... Ясное дело что ошибки будут , ведь каждый вводит адрес так как ему хочется...
И всё же - может кто-то поделится своими идеями? Может своё мнение скжут те кто работали с mnoGoSearch , или кто работал с другими поисковыми движками?
 
Сверху