Toxic_Cat
Новичок
UTF-8 - CP1251 битые символы
База, таблицы в cp1251_general_ci, а даннные в них фиг знает в какой кодировке.
Уже битый час пытаюсь привести и таблицы и данные к единой кодировке.
Англоязычные символы отлично себя чувствуют, а вот русскоязычные это кошмар.
$text = iconv("UTF-8", "CP1251", $text);
Вот не понимаю, почему буква "ш" - битая... (еще говорят что бьется "И" но как ни странно в тексте большой "И" не встречается)
Помогите, плиз, решить задачу.
Я вижу один вариант:
- str_replace заменяем символы будущей "ш" и "И" на уникальный набор символов (допустим "ш" => "...", "И" => "....")
- iconv
- str_replace возвращаем буквы на место
Но вот проблема, я не могу никак понять в каком виде хранится "ш", т.е. как ее записать в блокноте для замены? Так-же и с "И"... (еще я не уверен, что только две буквы битые)
Как думаете, реально ли восстановить базу?
База, таблицы в cp1251_general_ci, а даннные в них фиг знает в какой кодировке.
Уже битый час пытаюсь привести и таблицы и данные к единой кодировке.
Англоязычные символы отлично себя чувствуют, а вот русскоязычные это кошмар.
$text = iconv("UTF-8", "CP1251", $text);
Вот не понимаю, почему буква "ш" - битая... (еще говорят что бьется "И" но как ни странно в тексте большой "И" не встречается)
Помогите, плиз, решить задачу.
Я вижу один вариант:
- str_replace заменяем символы будущей "ш" и "И" на уникальный набор символов (допустим "ш" => "...", "И" => "....")
- iconv
- str_replace возвращаем буквы на место
Но вот проблема, я не могу никак понять в каком виде хранится "ш", т.е. как ее записать в блокноте для замены? Так-же и с "И"... (еще я не уверен, что только две буквы битые)
Как думаете, реально ли восстановить базу?