Фильтрация данных на мат и контактные данные

scorpion-ds

Новичок
Добрый день!

Стоит задача написать фильтр на мат и контактные данные которые пользователь может вводить, кроме того фильтроваться должны даже скрытые E-mail (и другие контактные данные) к примеру вида "n_a_m_e_@_d_o_m_e_n_._c_o_m", примерно тоже самое касается и мата.

Гугол никакой конкретики не предложил, хотя искал я еще немного, на данный момент я должен только оценить трудозатраты на реализацию данного функционала. Если есть готовые решения, то готов их рассмотреть.
 

Вурдалак

Продвинутый новичок
Пусть тот, кто дал такую задачу, покажет где в этом мире существует такого рода фильтрация.

Хотя можно пойти по пути троллинга. Пусть даст список слов и точные критерии того, что считать скрытым матом, контактами и т.д.

Но задачу решать нельзя в таком виде.
 

scorpion-ds

Новичок
Пусть даст список слов и точные критерии того, что считать скрытым матом, контактами и т.д.
Указано, что контактные данные (E-mail, телефоны и URL) должны фильтроваться без использования справочников, для мата (слова и словосочетания) справочники допустимы. Кроме того крайне важна скорость работы.
 
Последнее редактирование:

hell0w0rd

Продвинутый новичок
n_a_m_e_@_d_o_m_e_n_._c_o_m - а что в этом email плохого, за исключением того, что он не валиден?
 

Вурдалак

Продвинутый новичок
Указано, что контактные данные (E-mail, телефоны и URL) должны фильтроваться без использования справочников, для мата (слова и словосочетания) справочники допустимы. Кроме того крайне важна скорость работы.
Что такое «скрытый email»? Определение вида «ну это когда я вот так пишу знаки подчёркивания, вот!» в жопу пусть заказчик себе засунет. Какие ещё справочники мата? Пусть предоставит.
 

scorpion-ds

Новичок
Согласен со всеми отписавшимися, мы тут немного обсудили в коллективе и не нашли ни какого решения данной задаче, комбинаций сокрытия может быть масса, к примеру телефон можно написать словами, в мыле использовать символы разных языков, вперемешку с чем угодно.
 

scorpion-ds

Новичок
Интересная статья, хотя мой случай немного о другом, наверно даже все более запущено, не в отельной взятой строке надо искать текст, где знаешь на что должен проверять, а в произвольном тексте обнаруживать попытки ввода ссылок, е-мыл, телефонов в скрытом виде, и отдельно мата, с ним попроще, можно просто по словарю.

После последнего моего сообщения здесь, я отказался от здания, но мне его снова вернули, я снова отказался, если вернут снова то я уже не смогу отказываться, придется что-то делать, пока я представляю только, что переделаю их библиотеку с процедурного кода на ООП, идей по алгоритмам анализа все еще нет.

Кстати, по статье с хабра, где упоминаются очень сложные алгоритмы анализа e-mail, у них тоже очень сложное регулярное выражение, я бы такого не придумал.
 
Последнее редактирование:

флоппик

promotor fidei
Команда форума
Партнер клуба
да не помогут там никакие алгоритмы:
пишите на флоппик-хвостик-собачки-яндекс-точка-ру
 

Linker

Новичок
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~##~~##~~#####~~~######~~##~~##~~##~~##~~##~~~##~##~~##~~##~~##~
~~####~~~##~~##~~##~~~~~~##~~##~~~##~##~~##~~~##~##~##~~~##~~##~
~~~##~~~~######~~####~~~~######~~~~####~~##~#~##~####~~~~##~###~
~~####~~~##~~~~~~##~~~~~~##~~##~~~~~~##~~##~#~##~##~##~~~###~##~
~##~~##~~##~~~~~~######~~##~~##~~~~###~~~#######~##~~##~~##~~##~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
Сверху