Не допустить дублирование записей в базе

igortik

Новичок
akd
Логично излагаешь :)

Релевантность будет неимоверно высока, но такой шаблон будет встречаться довольно редко, ИМХО, а ТС, как я понял, столкнулся с проблемой СПАММА живыми юзерами, которую ему с его точки зрения нужно решить :)

Я полагаю, "если не научить пхп" читать и логически мыслить (аля ИИ), то вариант остается лишь со сравнением групп данных.
 

akd

dive now, work later
Команда форума
igortik, что-то мне подсказывает, что именно в обьявлениях шаблоны будут встречаться часто.

к тому же где порог "довольно редко"? .. если скажем 1 из 1000 нормальных пользователей будет отшит? при этом что ты ему скажешь в ошибке? :)
а если 2 из 1000?

но, в целом такой подход допустим. если грубо:
1. "обьявление" не обрабатывается если попадает в 100% по любому негативному правилу. (пример негативного правила - пользователь или ип найдены в бан-листе)
2. "обьявление" попадает в список на модерацию, если у него найдены подозрительные признаки (пример - высокая релевантность с сообщением оставленым 2 минуты/часа/дня назад)
3. остальные обьявления сразу публикуются.

понятное дело, что работа такой системы зависит от кучи факторов и криворукости всех участников процесса (программера, спамера, хаксора и т.д.).
подобная фигня часто применяется при работе с деньгами, но схема сильно сложнее и вольности там намного меньше.
 

igortik

Новичок
akd
я думаю, ТС уже понял что к чему... :)
в идеале - здесь не обойтись без модерации именно подозрительных сообщений

Я полагаю, "если не научить пхп" читать и логически мыслить (аля ИИ), то вариант остается лишь со сравнением групп данных.
ну и дополнительная логика...
кстати, юзера можно и не отшивать пока система в тестовом режиме, а действительно, отправить на модерацию сообщение с ссылкой на схожие сообщения (для администратора), чтобы промониторить ситуацию и юзера не обидеть :)
 

Духовность™

Продвинутый новичок
Модерация то есть, безусловно. Но ваши варианты с сопоставлением объявления с уже имеющимися меня пока не устраивают, ибо по контактным данным сверять - бесполезно - их можно вводить разные и по разному, в разных вариациях написания. Особенно это актуально для рекламы веб-сайтов, когда можно в поле "телефон", "email" и "имя" указывать кучу левых символов, соответственно поиск по таким объявлениям не будет давать результата. Следовательно, вариант AmdY не дает 100% гарантии + проблема озвученная akd будет актуальна.
 

igortik

Новичок
Модерация то есть, безусловно. Но ваши варианты с сопоставлением объявления с уже имеющимися меня пока не устраивают, ибо по контактным данным сверять - бесполезно - их можно вводить разные и по разному, в разных вариациях написания. Особенно это актуально для рекламы веб-сайтов, когда можно в поле "телефон", "email" и "имя" указывать кучу левых символов, соответственно поиск по таким объявлениям не будет давать результата. Следовательно, вариант AmdY не дает 100% гарантии + проблема озвученная akd будет актуальна.
ну я могу еще раз ответить на поставленный вопрос, который звучал примерно так: "неадекваты дублируют текст объявления, что делать, мнения?".
Так вот в этом случае придется сравнивать именно тексты, их релевантность и подозрительные ставить на модерацию.

А если уже речь идет не об "неадекватах", а спаммерах, то это уже иная категория и надо минимизировать возможность авторегистрации с заполнением форм и модерировать сообщения и т.д.. это уже, как бы, иная категория...

Хотя, и модерация не даст 100% результат, если учесть то, что ты не в состоянии помнить тексты объявлений :)
Выходит, тебе все равно стоит проверять релевантность нововведенных текстов.
 
Сверху