Не валидный html в xml ?

fonbaron

Велосипедист
Добрый денью
Мне необходимо не валидный html привести к валидному.
Вот пример html:
PHP:
<div>
Привет <br> мир!
</div>
Делаю так
PHP:
$dom = new DOMDocument();		
		$dom->validateOnParse = true;
		$dom->loadHTML($content);
		$content=$dom->saveXML();
теперь в $content содрежится валидный html? но как мне избавиться от добавленных тегов, то есть забрать все что находится внутри html->body? они не нужны
 

Vladson

Сильнобухер
то есть забрать все что находится внутри html->body?
Для разборки HTML есть куча способов, а для заранее валидного и вовсе "стопицот" способов, вы ждёте просто готового решения потому что лень листать мануал ?
 

fonbaron

Велосипедист
Можно узнать, а где он невалидный ????
Для дальнейшей обработки с помощью xslt он не валидный

Для разборки HTML есть куча способов, а для заранее валидного и вовсе "стопицот" способов, вы ждёте просто готового решения потому что лень листать мануал ?
Не знаю, но я не нахожу
 

fonbaron

Велосипедист
Сделал вот таким образом, подскажите на сколько это правильно и если есть более правильные методы то подскажите пожалуйста.

PHP:
$dom = new DOMDocument();		
		$dom->validateOnParse = true;
		$dom->loadHTML($content);
		$root = $dom->documentElement;
		$content=$dom->saveXML($root);
		$del= array('<html>','<body>','</body>','</html>');
		
		$content=str_replace($del, '', $content);
		return $content;
 
Последнее редактирование:
Сверху