Разбиение статей по категориям

Alexxx_2

Новичок
Разбиение статей по категориям

Имеется список категорий, каждая из которых обладает набором ключевых фраз.
Задача - по этим ключевым фразам разбить список текстовых статей по категориям.
Никак не могу придумать более-менее оптимальное решение задачи, какие будут идеи?
(ps все хранится в mysql, безусловно что статья может принадлежать разным категориям)
 

Wicked

Новичок
Я делал так:

Измеряешь корреляцию ключевых фраз и статей. В самом простом случае это формулируется как "кол-во вхождений каждой фразы в статью".

Из этого каким-нибудь способом выводишь корреляцию "статьи и категории". Например, сумма по ключевым фразам этой категории.

Из этого принимаешь решение, относится ли статья к категории или нет.
 
Сверху