lanzer
Guest
WYSIWYG редактор и проблемы обработки данных
Есть стандартный WYSIWYG редактор, если вставить данные допустим из MSWord, то вставляется достаточно кривой html.
Требования нашей компании - стандарт xhtml, поэтому надо этот html привести в порядок. Пытаюсь написать эту вычистку средствами php.
У меня косяк в том, что надо не только вытащить название всех тегов, но и их аттрибуты, да еще и проверить нужен ли этот аттрибут. А если аттрибут не нужен или значение аттрибута не соответствует требованиям, то надо либо изменить это значение, либо удалить аттрибут.
Кто нибудь уже писал такое?
Может есть такой модуль в существующих системах OpenSource?
Пример:
<H1 style="MARGIN: 12pt 0cm 3pt; TEXT-ALIGN: center" align=center><SPAN lang=EN-US style="mso-ansi-language: EN-US"><STRONG><FONT size=5><FONT face=Arial>Test<?xml:namespace prefix = o ns = "urn:schemas-microsoft-comfficeffice" /><o></o></FONT></FONT></STRONG></SPAN></H1>
На выходе должно получиться:
<h1 align="center"><strong>Test</strong></h1>
Поделитесь опытом, комментариями...
Есть стандартный WYSIWYG редактор, если вставить данные допустим из MSWord, то вставляется достаточно кривой html.
Требования нашей компании - стандарт xhtml, поэтому надо этот html привести в порядок. Пытаюсь написать эту вычистку средствами php.
У меня косяк в том, что надо не только вытащить название всех тегов, но и их аттрибуты, да еще и проверить нужен ли этот аттрибут. А если аттрибут не нужен или значение аттрибута не соответствует требованиям, то надо либо изменить это значение, либо удалить аттрибут.
Кто нибудь уже писал такое?
Может есть такой модуль в существующих системах OpenSource?
Пример:
<H1 style="MARGIN: 12pt 0cm 3pt; TEXT-ALIGN: center" align=center><SPAN lang=EN-US style="mso-ansi-language: EN-US"><STRONG><FONT size=5><FONT face=Arial>Test<?xml:namespace prefix = o ns = "urn:schemas-microsoft-comfficeffice" /><o></o></FONT></FONT></STRONG></SPAN></H1>
На выходе должно получиться:
<h1 align="center"><strong>Test</strong></h1>
Поделитесь опытом, комментариями...