Автоопределение кодировки и перекодирование (MB Lib)

Активист

Активист
Команда форума
Автоопределение кодировки и перекодирование (MB Lib)

Поюзал поиск, не нашел того, что нужно.

Есть автоопределение кодировки средствами MB String Lib,
скажем,
mb_detect_encoding - определение кодировки (из всего того разнообразия кодировок, в поддержке).
На форуме по поводу этой функции нашел инфу о том, что эта функция не всегда определяет верно кодировку (верно или нет, не знаю).
и
mb_convert_encoding - конвертация мултибайтных кодировок,

К пример, я вижу два варианта изменения кодировки
mb_convert_encoding($string, "cp1251", "auto");
и
mb_convert_encoding($string, "cp1251", mb_detect_encoding($string));


Интересно, используется ли в обоих случаях один и тот же алгоритм определения кодировки исходного текста или нет, и какой вариант лучше всего использовать для достижения наиболее правильного результата.

Нужно для определения поисковых фраз из REFERER и последующей конвертации в CP1251 во внутренней статистики системы управления.
 

SiMM

Новичок
[m]mb_detect_encoding[/m] => [m]mb_detect_order[/m]
Из описания очевидно, что нифига оно не предназначено для однобайтовых кодировок.

> Поюзал поиск, не нашел того, что нужно.
Плохо искали?
 

Активист

Активист
Команда форума
сорри...

Выход вижу такой:

1. $result = mb_convert_encoding($string, "cp1251", "auto");
Если $result === false, тогда следовательно - однобайтная кодировка, и нужно использовать скрипт для определения того, какая кодировка использована (кириллическая), например: http://www.internet-technologies.ru/articles/article_322.html

-~{}~ 02.10.07 11:22:

Верно?
 
Сверху