Как с помощью регулярки вырезать атрибуты в HTML-тэгах?

mit

Новичок
Как с помощью регулярки вырезать атрибуты в HTML-тэгах?

Собственно вот и вопрос - Как с помощью регулярки вырезать атрибуты в HTML-тэгах? Заранее всем спасибо.
 

tf

крылья рулят
mit, удаить - очищение строки от них,
вырезать - это собрать их в массив для дальнейших действий,
ихмо
вот и спрашиваю
 

mit

Новичок
Ладно. Извиняюсь. Мне нужно сделать что-то вроде оптимизатора HTML. После обработки страницы любым WYSIWING редактором появляется куча различных атрибутов в html-тэгах. Это уродует страницу. Так вот мне нужно удалить эти атрибуты от туда. А вторым ходом (но это уже я сам) я пропишу классы в чистый html (имею ввиду class="бла-бла-бла").
 

tf

крылья рулят
может тебе лучше dom пройтись по тексту и посмотреть какие к теги подходят а какие нет?
ps/ я тут просто посмотрел на свой код который проверяет на допустимость тегов и их параметров и немного стыдно стало за это давнейшее творение и надо будет его немного переписать

После обработки страницы любым WYSIWING редактором появляется куча различных атрибутов в html-тэгах
, а вообще смени редактор, к примеры FCKeditor мало что добавляет

-~{}~ 11.11.06 16:04:

preg_replace('~<([^\s>]+)\s[^>]+>~','<$1>',$html);
WP, я об этом думал, но <a href="url">, если он захочет его когданибуть использовать или <img src="img.gif"> мало что оставит
 

mit

Новичок
Я бы с радостью сменил редактор. Но это встроеный редактор CMS (Битрикс). И поменять редактор нет возможности. Просто FCKEditor я знаю. Мне он нравится. Но тут как то проскакивал топик про его не безопасность.

-~{}~ 11.11.06 16:08:

P.S. Извиняюсь про вопрос не по теме. А можно ли доверять Tidy (Эта программа изначально разработана Web-консорциумом W3C.).
 

mit

Новичок
Большое спасибо. Но не совсем понятно что находится по этой ссылке.
 

mit

Новичок
Извиняюсь. Я понял что это))))

-~{}~ 11.11.06 16:29:

WP вы знаете лучшую CMS?
 

WP

^_^
mit
Да, у меня своя) И тебе того же желаю. Битрикс неровно курит в сторонке.
Но если у тебя нет возможности написать свою, то юзай уж точно не эту фигню.
Можно написать костыль который бы убирал лишние атрибуты, почитай про регулярки.
 

mit

Новичок
Уважаемый WP. Я уважаю ваши программерские способности, но чтобы написать CMS уровня Bitrix нужно команде (подчеркиваю) разработчиков попотеть не менее 1 года. Да и не у меня одного мнение что Bitrix лучшая CMS на постсоветском пространстве. Много проводилось анализов и выяснений по этому поводу.
то юзай уж точно не эту фигню.
У Вас есть факты по поводу фигни?
 

tf

крылья рулят
Уважаемый WP. Я уважаю ваши программерские способности, но чтобы написать CMS уровня Bitrix нужно команде (подчеркиваю) разработчиков попотеть не менее 1 года
команда необязательно, вменямый программист, вменяемые идеи, вменяемая реализация :)))
+ время :((

Да и не у меня одного мнение что Bitrix лучшая CMS на постсоветском пространстве. Много проводилось анализов и выяснений по этому поводу.
пиар
У Вас есть факты по поводу фигни?
а это уж в поиск по клубу ;) + описаная тобой проблема
 

WP

^_^
mit
Во-первых команда не обязательна, наоборот одному лучше - всё согласуется идеально, и не бывает ляпов.
Во-вторых ту систему писали ламеры которые недавно сели за PHP.
> У Вас есть факты по поводу фигни?
Я их хакал 2 раза.
tf
> команда необязательно, вменямый программист, вменяемые идеи, вменяемая реализация + время
Согласен =) Это всё присутствует.
 

mit

Новичок
Вот это новость. Вы не могли бы поподробнее рассказать в чем заключаются хаки?
 
Сверху