Проверка на дубликаты

preg · 17 Июн 2007

Проверка на дубликаты

Вопщем ищу алгоритм поиска дубликатов в базе.
Спрашивается что может быть проще:

SELECT * FROM news WHERE text = 'news'

ан нет не всё так просто ...
Дело вот в чём:

Имеем исходный кусок HTML текста.
Этот кусок парсим, преобразовываем пути в тегах типа <a>, <img> (сами теги остаются, меняются только пути), очищается от мусора и загоняется в базу... все отличия в текстах - только пути в тегах....

Далее необходимо сравнить исходный текст с текстом в базе, не обращая внимания на изменённые теги ...
конешно можно сделать strip_tags (либо удалить только теги <a> и <img>) и сравнить "чистый" текст, но что будет если текст будет состоять только из тегов <a>, <img> ?

Какие могут быть идеи по этому поводу?

зы: сорри если топиком ошипся...

зызы: Кто нить нает почему не пашет такая фишка

SELECT * FROM news WHERE title = 'text\'n\'text'

тоесть не находит записи с text'n'text

Mr_Max · 18 Июн 2007

Какие могут быть идеи по этому поводу?

Вопросы касающиеся грабинга на форуме не обсуждаются.

Обясните что делаете и зачем это вам нужно.

-~{}~ 17.06.07 23:03:

Кто нить нает почему не пашет такая фишка

mysql_error() что говорит?

preg · 18 Июн 2007

Вопросы касающиеся грабинга на форуме не обсуждаются.

эээ зачем грабинг ... чел постит новость\камент и в тексте меняются ссылки с
http://ya.ru на http://site.ru/go.php?url=http://ya.ru/
также и картинки ....
таком образом исключаются ссылки на др. сервера ...

mysql_error ничего не говрит )) просто не те результаты возвращает

Mr_Max · 18 Июн 2007

preg
Меняйте ссылки при выводе.
Текст в БД с ссылками храните в исходном виде

Trianon · 18 Июн 2007

Автор оригинала: preg
mysql_error ничего не говрит )) просто не те результаты возвращает

Значит записи с таким полем в таблице просто нет.
Как выглядит строка дампа, соответствующая этой записи?

Проверка на дубликаты

preg

Новичок

Mr_Max

Первый класс. Зимние каникулы ^_^

preg

Новичок

Mr_Max

Первый класс. Зимние каникулы ^_^

Trianon

Новичок