snark
Новичок
Имеет место жить или боян?
Собрал большую базу для статистической обработки текста. Мыслей где можно эту БД использовать, кроме тематического каталога не пришло в голову. Разница от обычного каталога в том, что программа сама будет рубрицировать сайт ну или можно чтобы пользователь всеже указывал категорию вручную, но тогда релевантность в категориях будут определятся по % приближенности к данной рубрике. Всего в базе 650 рубрик (порядка 2млн темаических связей с более чем 120тыс. слов (<3млн. словоформ), безусловно многие можно объединить. Хотел спросить, а вообще оно надо? Что я с этого буду иметь и вообще в наше время каталог вот эти не БАЯНИЩЕ? Понимаю, что может раньше, до поисковиков (в котором виде они сейчас) каталоги может и пользовались популярность, но сейчас-то кто ими пользуется? Ну нах они нужны если есть yandex-каьалог mail и тд. ?
Или может кто-нибудь предложит другую идею использования базы?
Спасибо!
Собрал большую базу для статистической обработки текста. Мыслей где можно эту БД использовать, кроме тематического каталога не пришло в голову. Разница от обычного каталога в том, что программа сама будет рубрицировать сайт ну или можно чтобы пользователь всеже указывал категорию вручную, но тогда релевантность в категориях будут определятся по % приближенности к данной рубрике. Всего в базе 650 рубрик (порядка 2млн темаических связей с более чем 120тыс. слов (<3млн. словоформ), безусловно многие можно объединить. Хотел спросить, а вообще оно надо? Что я с этого буду иметь и вообще в наше время каталог вот эти не БАЯНИЩЕ? Понимаю, что может раньше, до поисковиков (в котором виде они сейчас) каталоги может и пользовались популярность, но сейчас-то кто ими пользуется? Ну нах они нужны если есть yandex-каьалог mail и тд. ?
Или может кто-нибудь предложит другую идею использования базы?
Спасибо!