lelik17
Новичок
Здравствуйте! Встала перед о мной задача. Нужно определить степень похожести двух заголовков. Пример:
Путин отметит юбилей в кругу близких в Петербурге
Владимир Путин в Санкт-Петербурге отметит юбилей в кругу близких
Президент России Владимир Путин отмечает 60-летний юбилей
Невооружённым взглядом видно, что под этими заголовками скрывается одна и та же новость. Как можно определить это программно? Первое, что пришло в голову - разбить на слова и считать сколько слов совпало. Но может есть другие методы?
Путин отметит юбилей в кругу близких в Петербурге
Владимир Путин в Санкт-Петербурге отметит юбилей в кругу близких
Президент России Владимир Путин отмечает 60-летний юбилей
Невооружённым взглядом видно, что под этими заголовками скрывается одна и та же новость. Как можно определить это программно? Первое, что пришло в голову - разбить на слова и считать сколько слов совпало. Но может есть другие методы?