denisOg
Новичок
Есть массив фраз (pdf, pdf edit, pdf edit form,......) - таксих фраз около 4 млн и есть несколько текстов, около 10 000. Эти данные все время растут.
Нужно посчитать сколько каждая фраза встречается в тексте. Как быстрее это сделать?
Певрное что приходит на ум - искать регуляркой. Но как то долго и ресурсоемко.
Думал запихнуть эти текста в БД и делать поиск по тексту. Но нужно считать сколько раз совпало слово в тексте (а запрос просто выбирет текст)
Может есть сервис/библиотека/софт, который бы делал быстро и качественно эту работу?
Спасибою.
Нужно посчитать сколько каждая фраза встречается в тексте. Как быстрее это сделать?
Певрное что приходит на ум - искать регуляркой. Но как то долго и ресурсоемко.
Думал запихнуть эти текста в БД и делать поиск по тексту. Но нужно считать сколько раз совпало слово в тексте (а запрос просто выбирет текст)
Может есть сервис/библиотека/софт, который бы делал быстро и качественно эту работу?
Спасибою.