Возможно баг в SAX парсере

Daos

Новичок
Возможно баг в SAX парсере

Значит такая проблема обнаружилась, есть простейший xml
PHP:
<?xml version="1.0" encoding="windows-1251"?>
<categories>    
<category id="1" parentId="0">Сетевое оборудование</category>
</categories>
В php 5.0.4 под линуксом, при обработке обычным SAX парсером через xml_parser_create() происходит такая фигня

если внутри тега category первой идет цифра или буква латинского алфавита в нашем случае C (по ошибке например), то она не возвращается парсером при чем если первых латинских букв несколько то опускается они все, парсер возвращает только кирилицу. Если латинские буквы и цифры присутствуют в середине текста то все ок.

Например: 3Cетевое оборудование и Cетевое оборудование возвращает етевое оборудование

вот такой пример (& a m p ; слитно): 8000 & a m p ; 8300 возвращает 8300 хотя ожидается 8000 & 8300


Вот незнаю, есть какие идеи?
 

olpa

Новичок
SAX-парсер не обязан возвращать текст между тегами одним куском, но может разбивать его на фрагменты. Ваша программа, похоже, созраняет только последний фрагмент.
 

Daos

Новичок
Да именно так и есть, после любой смены знаков или пробела.
Вопрос снят.
 
Сверху