Духовность™
Продвинутый новичок
а почему не DOM? Расскажите, а то я не знаю, что такое xpath!с помощью xpath выдираем все тэги
-~{}~ 13.09.07 15:14:
За работу ещё не брался, но идея такая:triumvirat, основная проблема - необходимость полного анализа HTML кода на стороне сервера.
Идём DOM-ом по всем тегам. Смотрим аттрибуты. Удаляем все не разрешённые. Все "онклики" удаляем в обязательном порядке. Если в аттрибуте href замечен протокол javascript - тупо трём содержимое атрибута и заменяем на #.
Удалять лишние теги как - не знаю ещё. Либо strip_tags использовать, либо тем же DOM-ом.
Сейчас проверил ЖЖ. Закрытие у них хромает:
Код:
<a href="#" onclick="alert(1)"><b>отрппр<b>ss<i>ssss
Код:
<a href="#"><b>отрппр<b>ss<i>ssss</a></b></b></i>