Проверка на дубликаты

preg

Новичок
Проверка на дубликаты

Вопщем ищу алгоритм поиска дубликатов в базе.
Спрашивается что может быть проще:

SELECT * FROM news WHERE text = 'news'

ан нет не всё так просто ...
Дело вот в чём:

Имеем исходный кусок HTML текста.
Этот кусок парсим, преобразовываем пути в тегах типа <a>, <img> (сами теги остаются, меняются только пути), очищается от мусора и загоняется в базу... все отличия в текстах - только пути в тегах....

Далее необходимо сравнить исходный текст с текстом в базе, не обращая внимания на изменённые теги ...
конешно можно сделать strip_tags (либо удалить только теги <a> и <img>) и сравнить "чистый" текст, но что будет если текст будет состоять только из тегов <a>, <img> ?

Какие могут быть идеи по этому поводу?


зы: сорри если топиком ошипся...

зызы: Кто нить нает почему не пашет такая фишка

SELECT * FROM news WHERE title = 'text\'n\'text'

тоесть не находит записи с text'n'text
 

Mr_Max

Первый класс. Зимние каникулы ^_^
Команда форума
Какие могут быть идеи по этому поводу?
Вопросы касающиеся грабинга на форуме не обсуждаются.

Обясните что делаете и зачем это вам нужно.

-~{}~ 17.06.07 23:03:

Кто нить нает почему не пашет такая фишка
mysql_error() что говорит?
 

preg

Новичок
Вопросы касающиеся грабинга на форуме не обсуждаются.
эээ зачем грабинг ... чел постит новость\камент и в тексте меняются ссылки с
http://ya.ru на http://site.ru/go.php?url=http://ya.ru/
также и картинки ....
таком образом исключаются ссылки на др. сервера ...

mysql_error ничего не говрит )) просто не те результаты возвращает
 

Mr_Max

Первый класс. Зимние каникулы ^_^
Команда форума
preg
Меняйте ссылки при выводе.
Текст в БД с ссылками храните в исходном виде
 

Trianon

Новичок
Автор оригинала: preg
mysql_error ничего не говрит )) просто не те результаты возвращает
Значит записи с таким полем в таблице просто нет.
Как выглядит строка дампа, соответствующая этой записи?
 
Сверху