HTML to XML & Tidy

pamgmen

Новичок
Добрый вечер.

Начал разбираться с XPath.. С ним проще парсить контент HTML-страниц..
Но - на-сколько я понял, он работает с XML... и HTML нужно сначала перегнать в XML..
Для этого я так понимаю используется Tidy.

Вопрос - как Tidy установить?? с сайта скачиваются не PHP-библиотеки а другие файлы, с ними дело не имел...
Или существует более простой способ парсить HTML с помощью XPath?
 

pamgmen

Новичок
парсинг HTML страницы..
регулярки не спасают.

Или проще: как парсить HTML используя XPath?
 

shelestov

я тут часто
Парсить HTML как XML документ ИМХО не реально, так как 99% страниц в интернете невалидные.
 

shureen

Милорд Лось Кристофер
2shelestov если прогнать через Tidy, то вполне реально и даже удобно
 

pamgmen

Новичок
Глянул ссылку..

Может просто напишите пару инструкций как и куда устанавливать? (Под Win7 и Denwer)
Буду очень признателен..
 
Сверху