v7
Новичок
Проблемы при перекодировании из UTF-8
Есть xml-файл (экспорт базы windows-программы).
Данные о кодировке в нем не указаны (т.е. UTF-8)
При попытке перекодировать в Windows-1251 часть текстов перекодируются нормально, а некоторые только немного изменяются.
Перекодировал по-разному: iconv(), функции из FAQ
Пример исходного текста - "Р_С’Р_ІС‚Р_С•Р_С?Р_С•Р_В±Р_С‘Р_В»Р_С‘"
Получается - "РРІС‚РРРРВ±РёР»и"
Должно быть - "Автомобили"
В чем может быть проблема?
P.S. В примере исходного текста пробелы заменились на подчеркивания.
P.P.S. Для UTF-8 слишком много символов - слово из 10 букв в UTF-8 - 20 символов, а здесь ~ 40 символов. Какое-то двойное перекодирование или другая кодировка?
Есть xml-файл (экспорт базы windows-программы).
Данные о кодировке в нем не указаны (т.е. UTF-8)
При попытке перекодировать в Windows-1251 часть текстов перекодируются нормально, а некоторые только немного изменяются.
Перекодировал по-разному: iconv(), функции из FAQ
Пример исходного текста - "Р_С’Р_ІС‚Р_С•Р_С?Р_С•Р_В±Р_С‘Р_В»Р_С‘"
Получается - "РРІС‚РРРРВ±РёР»и"
Должно быть - "Автомобили"
В чем может быть проблема?
P.S. В примере исходного текста пробелы заменились на подчеркивания.
P.P.S. Для UTF-8 слишком много символов - слово из 10 букв в UTF-8 - 20 символов, а здесь ~ 40 символов. Какое-то двойное перекодирование или другая кодировка?
