Bermuda
Новичок
Реализация системы тэгов (тагов)
Стоит задача реализации системы тэгов для контента который юзеры постят на сайте.
Если позволить пользователям самим безконтрольно вводить любые тэги, то ничего путного не выйдет, потому как один введет "кошка", а другой "кошки", что скорее всего является "синонимами" и должна будет реализоваться связь по этому тэгу, но этого не произойдет.
Мой параноидальный мозг подсказывает реализации на основании словарей, синонимов и нормализации слов.
Таг введенный пользователем нужно нормализовать, т. е. привести в нормальную форму (например для русского это будет единственное число, мужской род, именительный падеж, неопределенное время). Опционально можно поискать синонимы и заменить слова на наиболее часто употребимое. Язык -- нерусский
В этом месте мне становится страшно.
Подскажите, где посмотреть правильные системы реализации тэгов?
Можно ли реализовать "правильную" систему тэгов без словаря?
Есть ли какая-либо теория нормализации слов для произвольного языка?
Стоит задача реализации системы тэгов для контента который юзеры постят на сайте.
Если позволить пользователям самим безконтрольно вводить любые тэги, то ничего путного не выйдет, потому как один введет "кошка", а другой "кошки", что скорее всего является "синонимами" и должна будет реализоваться связь по этому тэгу, но этого не произойдет.
Мой параноидальный мозг подсказывает реализации на основании словарей, синонимов и нормализации слов.
Таг введенный пользователем нужно нормализовать, т. е. привести в нормальную форму (например для русского это будет единственное число, мужской род, именительный падеж, неопределенное время). Опционально можно поискать синонимы и заменить слова на наиболее часто употребимое. Язык -- нерусский

В этом месте мне становится страшно.
Подскажите, где посмотреть правильные системы реализации тэгов?
Можно ли реализовать "правильную" систему тэгов без словаря?
Есть ли какая-либо теория нормализации слов для произвольного языка?