UTF-8: кирилица есть, а литиницы нет

  • Автор темы Romario Bell
  • Дата начала

Romario Bell

Guest
UTF-8: кирилица есть, а литиницы нет

Есть исходный файл xml в кодировку windows-1251, CDATA которого представлены в кирилице и латинице одновременно.

При помощи функций xml_parser'а получаю на выходе CDATA в UTF-8, но при этом вся латиница оттуда исчезает.

Вопрос: Почему исчезла латиница и как с этим бороться?

-~{}~ 11.10.05 13:46:

Добавлю еще такое: если нету символов пробела переноса строки и русских символов, то проблемы не возникает.
 

slach

Новичок
есть
комментарии глянуть
по различиям между php4 и php5 в
http://www.php.net/manual/en/function.xml-set-character-data-handler.php

еще стоит почитать
http://www.php.net/manual/en/ref.xml.php#xml.encoding

вообще поведение достаточно странное
система win32 ??
expat.dll какой версии?
IMHO имеет смысл ставть http://libexpat.sf.net поновее

-~{}~ 19.10.05 07:49:

http://www.php.net/manual/en/function.xml-parser-create.php
вот тут еще почитай
про encoding
 

Romario Bell

Guest
Спасибо, slach.
Я уже в отчаянии порвал книгу-руководство, поджег бороду редактору и проч :)...
А вообще решил обойтись регулярными выражениями, хоть какой-то parser написал.
Система у меня win32, php скачал последний 3 недели назад, поэтому влом смотреть версию expat. А статьи эти я читал уже. Мне не помогло.
 
Сверху