Поиск похожих данных

evolution

Новичок
Поиск похожих данных

Стоит задача поиска похожих данных.

Есть таблица с некими числовыми значениями.
Типа таких:
35995840617720
26324508613925
98501884828806

Стоит задача поиска нечётких дублей.
Т.е. найти например
35995840617720
и
45995840917720
и
35995840617711

Что-то у меня мыслей никаких вообще нет, как искать...
Можете помочь?
 

dimagolov

Новичок
искать совпадающие подстроки максимальной длинны. можно сразу начинать с какой-то минимальной.
 

evolution

Новичок
rotoZOOM:

Скажу как объяснили: "Найти наиболее похожие комбинации и отсортировать по убыванию похожести" =)
 

rotoZOOM

ACM maniac
evolution Значит дай это определение сам себе. А именно введи понятие "степень похожести", введи порог ограничения "похож"/"не похож" для этой степени. Задай входные условия. (например, одно из условий может быть: длина всех чисел одинакова и равна N). Напиши этот алгоритм на бумажке, как бы ты это делал руками. А вот потом уже перетаскивай на ЯП.
 

korchasa

LIMB infected
Как определяется "похожесть"?

Чем лучше ты ответишь себе на этот вопрос, тем ближе ты будешь к решению ;)
 

AmdY

Пью пиво
Команда форума
и подсказка, в php есть функции согласно некоторым алгоритмам из той ссылки, найдёшь сам по имени алгоритмов, например, растояние левенштейна

-~{}~ 05.02.09 16:08:

опоздал :(
 

AmdY

Пью пиво
Команда форума
странно, что мы сообщили об одном и том же алгоритме, можно же было similar_text
 
Сверху