demon_mhm
Новичок
убрать левые символы из XML документа
Есть такая проблема. Приходит сторонний XML-файл,достаточно объемный. Но, местами там попадаются какие-то кривые символы типа копирайтов или траейдмарков и ХЗ чего вообще, и парсинг документа, естественно валится. Кто-нибудь может подсказать, как программно убрать всю левоту из документа? Тоесть оставить только русские-английские буквы, знаки пунктуации, теги и пр... Понятно, что надо прогонять через регулярку, есть спецы по регулярным выражениям? Помогите пожалуйста или хоть ткните носом где поискать?
Есть такая проблема. Приходит сторонний XML-файл,достаточно объемный. Но, местами там попадаются какие-то кривые символы типа копирайтов или траейдмарков и ХЗ чего вообще, и парсинг документа, естественно валится. Кто-нибудь может подсказать, как программно убрать всю левоту из документа? Тоесть оставить только русские-английские буквы, знаки пунктуации, теги и пр... Понятно, что надо прогонять через регулярку, есть спецы по регулярным выражениям? Помогите пожалуйста или хоть ткните носом где поискать?