Пишу парсер html

Ord

Новичок
Пишу парсер html

пишу небольшой парсер html, написал вот что

preg_match("|<xxx[^\>]*>(.*?)<\/xxx>|isU", $data ,$out); (построил на основе другого рег выражения, найденного на форуме)


но толком так и не разобрался в регулярных выражениях, подскажите пожалуйста где можно почитать - желательно на русском языке - хорошую документацию по регулярным выражениям или по парсингу, чтобы хорошенько разобраться :)
 

ViJu

Новичок
ты очень ошибаешься если думаешь, что парсинг это регексп, для правильного разбора html лучше воспользоаться соответствующими методами из Dom расширения, если PHP5

DOMDocument->loadHTML() - Load HTML from a string
DOMDocument->loadHTMLFile() - Load HTML from a file
 

Wicked

Новичок
а если пхп4 - то можно tidy + любая xml библиотека (php4 dom xml, xml parser, etc) :)
 
Сверху