Снова про кириллицу & WAP

corvus

Guest
Снова про кириллицу & WAP

Господа, кто знает, примерно какой процент мобильников, имеющихся сейчас в использовании у российских абонентов, не поддерживает кириллицу?

Просто смотрю, у некоторых WAP-сайтов есть версия (зеркало) на транслите, а у некоторых нету, только кириллица. Насколько это, по-вашему, актуально?


Ведь на большинстве вап-сайтов текст в UTF-8 (русские буквы в виде &#четырецифры), а не в вин-1251 или КОИ-8, то есть на любой мобиле будет верно отображаться? Или я не прав?
 

SiMM

Новичок
> ведь на большинстве вап-сайтов текст в UTF-8 (русские буквы в виде &#четырецифры)
Это не UTF-8. Это HTML-представление Unicode-символов. Что такое UTF-8 можно узнать, например, здесь

> на любой мобиле будет верно отображаться?
Сомневаюсь, что в любой мобиле прошиты ВСЕ символы из ~65500 возможных в Unicode

А вообще - использование транслита позволяет уменьшить объём передаваемого контента - вместо использования 7 байт для кодирования русской буквы используется всего лишь 1-2-3 байта. Для wap критичен объём странички в байтах (по крайней мере в старых моделях это вроде было так).
 

voodoo

Новичок
по скромной статистике за вчера -- 2.01% запросов к транслит страницам.

Автор оригинала: SiMM
> на любой мобиле будет верно отображаться?
Сомневаюсь, что в любой мобиле прошиты ВСЕ символы из ~65500 возможных в Unicode
Маловато что-то. Надо символы для болда, для италика ;) (встречались и такие телефоны, кажется motorola, где русский обычным шрифтом показывает нормально, а, скажем, жирный -- квадратами)

Ну и 7 байт на символ это все-же слишком много. УТФ-8 гораздо приятнее. А если еще заменять а на a, то разница в размере с транслит версией будет еще меньше (хотя на "некоторых других" телефонах с этим будут косяки -- латинские и русские буквы на них отображаются разными шрифтами)
 

SiMM

Новичок
> Надо символы для болда, для италика
В лучшем (в плане экономии памяти) случае их можно получать программно ;)

> УТФ-8 гораздо приятнее
Ну да :) Просто видимо некоторые поначалу не понимали или не знали, что такое UTF-8 - отсюда и 7 байт на символ (попадались даже варианты кодирования типа &#x0\d{3}; - могли бы хоть на ведущем нуле сэкономить :) ).

> А если еще заменять а на a
Тоже мысль :)
 
Сверху