kode
never knows best
Степень похожести бинарных файлов
Предложите вариант получения степени похожести бинарных файлов.
Суть такова: пишется бот, который будет собирать картинки. Но картинки могут отличатся друг от друга одним пикселем (таким кол-вом чтобы суть изображения не менялась, обьяснять долго - но такое есть). Просто хотелось бы чтобы схожие (с точки зрения человека) дубликаты картинки не сохранялись.
Моя идея: Возможно это будет немного ресурсо затратно, но думаю что стоит считать дерево хешей (Tiger) (размер сегмента верхнего (первого) уровня зависит от размера файла) и сравнивать их на соответсвующем размеру файла уровне (а не в корне)
Сразу оговорюсь что бот пишется на яве
Предложите вариант получения степени похожести бинарных файлов.
Суть такова: пишется бот, который будет собирать картинки. Но картинки могут отличатся друг от друга одним пикселем (таким кол-вом чтобы суть изображения не менялась, обьяснять долго - но такое есть). Просто хотелось бы чтобы схожие (с точки зрения человека) дубликаты картинки не сохранялись.
Моя идея: Возможно это будет немного ресурсо затратно, но думаю что стоит считать дерево хешей (Tiger) (размер сегмента верхнего (первого) уровня зависит от размера файла) и сравнивать их на соответсвующем размеру файла уровне (а не в корне)
Сразу оговорюсь что бот пишется на яве