Очистка базы

seva2

Партнер PHPClub.ru
Очистка базы

Такой вопрос, есть база по срокам доставки:

В ней есть города
Самара
г.Самара
г. Самара
Самара, Самарская область

Или
Волжск
Волжский
п. Волжск
п. Волжский

Поле города Fulltext.
Как выташить Схожие названия?
 

ys

отодвинутый новичок
На ум приходит такое:
Вытащить самое маленькое (по длине) и сравнивать по вхождению?

-~{}~ 24.07.08 14:31:

Правда есть и косяки, пример тому: "Омск" и "Томск"
 

Армян

Новичок
ys
и если будут записи типа:
Самара
Самарская область

тоже не проканает
 

ys

отодвинутый новичок
Армян

Мм.
А Самара и Самарская область это вроде бы две разные вещи?
Как, например, Москва и Московская область.
 

seva2

Партнер PHPClub.ru
Нет это две одинаковые, самара, а вот
Волжск
Волжский

Разное)
 

kruglov

Новичок
Ну тут это, думать надо.

Самарская область без Самары может попадаться?
Если нет, то забить на области, а проверять на полное соответствие названий городов, отфильтровав названия областей.
 
Сверху