kif0rt
Новичок
Проблема. Не парсится HTML страничка.
Вообщем надо мне распарсить html страничку и выдрать оттуда кое-какие данные.
Пытался делать так:
Парсим:
OK не появился
file_get_contents файл считывает номрально.
Вообщем надо мне распарсить html страничку и выдрать оттуда кое-какие данные.
Пытался делать так:
PHP:
$html2xml = new DOMDocument();
$html2xml->loadHTML($Result);
$html2xml->formatOutput = true;
$html2xml->saveHTMLfile('out.xml');
PHP:
class MyClass
{
private $xmlParser = null;
public function parseHtmlToArray($pageHTML)
{
$this->xmlParser = xml_parser_create('');
xml_parser_set_option($this->xmlParser, XML_OPTION_TARGET_ENCODING, 'UTF-8');
xml_set_object($this->xmlParser, $this);
xml_set_element_handler($this->xmlParser, 'startElementHandler', 'endElementHandler');
xml_set_character_data_handler($this->xmlParser, 'dataHandler');
xml_parser_set_option($this->xmlParser, XML_OPTION_CASE_FOLDING, false);
xml_parse($this->xmlParser, file_get_contents($pageHTML));
xml_parser_free($this->xmlParser);
}
private function startElementHandler($xmlParser, $tagName, $attributes)
{
$tagName = strtolower($tagName);
$attributes = array_change_key_case($attributes, CASE_LOWER);
//echo $tagName;
echo 'OK';
}
private function endElementHandler($xmlParser, $tagName)
{
}
private function dataHandler($xmlParser, $data)
{
}
}
$bla = new MyClass();
$bla->parseHtmlToArray('http://127.0.0.1/work/out.xml');
