Преобразование html2xml

sokol

Zavolga.Net
Преобразование html2xml

Есть задача преобразовать невалидный HTML код в в алидный XML. Есть ли готовый инструментарий для PHP? Скачал класс PEAR::HTMLSax3, написал обработчки. В принципе все работает, только никак не могу разобраться, что делать если у элемента нет закрывающего тега.

Подскажите плз если кто сталкивался с этой задачей.
 

voituk

прозревший
Для этого вроде есть библиотека tidy.
Копай в её сторону.
 

ViJu

Новичок
Если php5, то копать лучше

$doc = DOMDocument::loadHTMLFile('verydirty.html');
$doc->saveXML()
 
Сверху