Bor-ka
Новичок
Хранение в файле адреса и списка слов (+)
Имеется некоторая текстовое значение с адресом документа + имеется некий список слов для документа.
Количество документов - от нескольких тысяч. Необходимо хранить адрес документа (текстовое значение),
слова (+ в последствии некий вес для каждого слова).
Прошу помочь по следующим вопросам:
1. Лучше хранить отдельно словарь, и отдельно адреса с индексами слов из словаря или все в одном?
2. Каким образом наиболее оптимально с точки зрения скорости работы и размера файлов хранить эти данные? Критично ко времени выполнения и объему RAM.
3. Данные хранить в оригинальном (текстовом) виде или обрабатывать какой либо хэш функцией? Если хэш, то какой лучше?
от хранения данных в БД отказался.
Что курить по этим вопросам?
Заранее благодарю за помощь.
Имеется некоторая текстовое значение с адресом документа + имеется некий список слов для документа.
Количество документов - от нескольких тысяч. Необходимо хранить адрес документа (текстовое значение),
слова (+ в последствии некий вес для каждого слова).
Прошу помочь по следующим вопросам:
1. Лучше хранить отдельно словарь, и отдельно адреса с индексами слов из словаря или все в одном?
2. Каким образом наиболее оптимально с точки зрения скорости работы и размера файлов хранить эти данные? Критично ко времени выполнения и объему RAM.
3. Данные хранить в оригинальном (текстовом) виде или обрабатывать какой либо хэш функцией? Если хэш, то какой лучше?
от хранения данных в БД отказался.
Что курить по этим вопросам?
Заранее благодарю за помощь.

