WP
^_^
Проблема с %uXXXX
Как известно Javascript escape'ит юникод используя запись вида %uXXXX,
//string(33) "Kolik času str�v�te na Internetu"
Оригинал - Kolik času strávíte na Internetu ?
Т.е. символ "á" не перекодируется.
Пожалуйста подскажите кто как решает данную проблему (нужна кошерная функция). На выходе нужно получить UTF-8.
iconv из UCS-2BE дает то же самое что и из UTF-16BE.
Как известно Javascript escape'ит юникод используя запись вида %uXXXX,
PHP:
$s = 'Kolik%20%u010Dasu%20str%E1v%EDte%20na%20Internetu';
$r = urldecode(preg_replace('~%u([a-f\d]{4})~ei','urlencode(iconv("UTF-16BE","UTF-8",pack("H4","$1")))',$s));
var_dump($r);
Оригинал - Kolik času strávíte na Internetu ?
Т.е. символ "á" не перекодируется.
Пожалуйста подскажите кто как решает данную проблему (нужна кошерная функция). На выходе нужно получить UTF-8.
iconv из UCS-2BE дает то же самое что и из UTF-16BE.