Cid
...двинутый новичок
Преобразование HTML в XML
Обсуждение. Личный опыт.
Задача - с помощью XML-функций в PHP преобразовать имеющийся (произвольный) HTML-файл в формат XML. Поскольку HTML-документ можно рассматривать как частный случай XML, то можно натравить на него xml_parse()....
В общем, без регэкспов - никуда. Все равно сначала придется
- пройти по всему документу и заключить в кавычки все незаключенные в них атрибуты всех тэгов
- привести названия всех тэгов к одному регистру
- все незакрывающиеся по определению тэги привести к виду <TAG />
- но самое главное - это ошибки верстки, связанные с отсутствием закрывающих тэгов... как это обойти - большой вопрос!
Кто еще с этим сталкивался, может, уже есть готовые преобразователи?
Обсуждение. Личный опыт.
Задача - с помощью XML-функций в PHP преобразовать имеющийся (произвольный) HTML-файл в формат XML. Поскольку HTML-документ можно рассматривать как частный случай XML, то можно натравить на него xml_parse()....
В общем, без регэкспов - никуда. Все равно сначала придется
- пройти по всему документу и заключить в кавычки все незаключенные в них атрибуты всех тэгов
- привести названия всех тэгов к одному регистру
- все незакрывающиеся по определению тэги привести к виду <TAG />
- но самое главное - это ошибки верстки, связанные с отсутствием закрывающих тэгов... как это обойти - большой вопрос!
Кто еще с этим сталкивался, может, уже есть готовые преобразователи?