encyclop
Guest
Парсинг RSS через DOM XML
Привет всем и с наступлением летнего сезона!
Хочу наладить парсинг RSS через DOM XML (http://ru.php.net/domxml), но столкнулся с двумя проблемами:
1. не парсятся xml-файлы, где у нити rss есть "атрибут" xmlns.
Пример:
<rss version="2.0" xmlns="http://some.server.com/dir">
Как атрибут у rss его нельзя взять ни по отдельности get_attribute_node, get_attribute), ни в группе (attributes), ни тем более его изменить, ни удалить (remove_attribute)
Вопрос: как его убрать? Через DOM XML, разумеется...
Если вы у нить rss была в виде
<rss version="2.0">
все было бы отлично (почти).
2. При получении пропарсенных файлов (удалении вручную куска xmlns на тестируемом файле) данные собираются в умопомрачительной кодировке и это при том, что документу предшествует строчка
<?xml version="1.0" encoding="windows-1251"?>
Пример:
Крепи дисциплину трудом!
...будет как...
Крепи дисциплину трудом!
Заранее спасибо.
Привет всем и с наступлением летнего сезона!
Хочу наладить парсинг RSS через DOM XML (http://ru.php.net/domxml), но столкнулся с двумя проблемами:
1. не парсятся xml-файлы, где у нити rss есть "атрибут" xmlns.
Пример:
<rss version="2.0" xmlns="http://some.server.com/dir">
Как атрибут у rss его нельзя взять ни по отдельности get_attribute_node, get_attribute), ни в группе (attributes), ни тем более его изменить, ни удалить (remove_attribute)
Вопрос: как его убрать? Через DOM XML, разумеется...
Если вы у нить rss была в виде
<rss version="2.0">
все было бы отлично (почти).
2. При получении пропарсенных файлов (удалении вручную куска xmlns на тестируемом файле) данные собираются в умопомрачительной кодировке и это при том, что документу предшествует строчка
<?xml version="1.0" encoding="windows-1251"?>
Пример:
Крепи дисциплину трудом!
...будет как...
Крепи дисциплину трудом!
Заранее спасибо.