loadXML() превращает utf-8 в ересь

Leek

Новичок
loadXML() превращает utf-8 в ересь

На сервер приходит некий HTML в UTF-8. Достаточно провернуть с ним loadXML, и кириллицу мы безвозвратно теряем. То есть, если вывести обратно пришедшую строку, все замечательно, но если выводить saveXML(), получаем нечто вроде <?xml version="1.0"?>&amp;#x444;&amp;#x44B;&amp;#x432;&amp;#x430; Просто ради теста получаем какой-нибудь нод и выводим nodeValue: &Ntilde;&Ntilde;&ETH;&sup2;&ETH;&deg;.
Кто-нибудь может объяснить, что происходит?
 

Wicked

Новичок
ой ли... прям уж безвозвратно? сохрани себе на диск xml-файл с содержимым <?xml version="1.0"?><root>&amp;#x444;&amp;#x44B;&amp;#x432;&amp;#x430;</root> и открой его в IE или FF.

Так что копай в сторону, что у тебя что-то неправильно именно в месте:
Просто ради теста получаем какой-нибудь нод и выводим nodeValue: &#209;&#209;&#208;&#178;&#208;°.
 
Сверху