Balancer
Guest
Как узнать, что строка - в UTF-8 кодировке?
Есть MySQL-база, которая в своё время не шибко корректно была законвертирована из cp1251/MySQL-4.0.x в UTF-8/MySQL-4.1.x
Выражается это в том, что часть данных в UTF-8 таблице осталась в 1251-й кодировке. Всё бы ничего, но если эти данные потом вставлять в другие таблицы, то MySQL 4.1.3beta виснет (как и предыдущие 4.1.x).
Решение очевидное - пройти PHP-скриптом по всем записям, найти те из них, кто некорректен в UTF-8 и конвертнуть их из 1251 в UTF-8.
Вот только беда одна - непонятно, как определить, что строка именно в cp1251, а не в UTF-8.
Есть мысли?
Есть MySQL-база, которая в своё время не шибко корректно была законвертирована из cp1251/MySQL-4.0.x в UTF-8/MySQL-4.1.x
Выражается это в том, что часть данных в UTF-8 таблице осталась в 1251-й кодировке. Всё бы ничего, но если эти данные потом вставлять в другие таблицы, то MySQL 4.1.3beta виснет (как и предыдущие 4.1.x).
Решение очевидное - пройти PHP-скриптом по всем записям, найти те из них, кто некорректен в UTF-8 и конвертнуть их из 1251 в UTF-8.
Вот только беда одна - непонятно, как определить, что строка именно в cp1251, а не в UTF-8.
Есть мысли?