перевод CMS на UTF-8

CHEM_Eugene

Новичок
перевод CMS на UTF-8

Здравствуйте!

На этапе проектирования cms не было заложено функционала для поддержки многоязычных сайтов.
Ушли не очень далеко, слава Богу, одумались. Написали так скажем базу, основной стержень.
Теперь очевидно, что для многоязычных сайтов необходимо хранить контент в utf-8.
Подскажите - что в 1ю очередь нужно настроить для работы с этой кодировкой.
Первым на ум приходит:
1. Настроить инструментарий (Eclipse) для работы в utf-8 и переписать весь общий текст (статусные сообщения, сообщения
пользователю, сообщения об ошибках и т.д.).
2. Настроить БД для работы с utf-8 (Как? Что конкретно необходимо подкрутить?)
3. Заменить заголовки в шаблонах (html и xml)

Что кто думает по этому поводу?
И вообще правильно ли я подхожу к вопросу? Как бы это сделали Вы?

Спасибо.
 

Beavis

Banned
а зачем текст переписывать? его можно открыть как ANSI а сохранить как UTF-8
 

CHEM_Eugene

Новичок
Автор оригинала: Beavis
а зачем текст переписывать? его можно открыть как ANSI а сохранить как UTF-8
Я это и имею в виду.

-~{}~ 11.07.08 13:49:

С 1 пунктом вроде прояснили. А что по остальному?
 

Kirill

Новичок
модифицировать регулярки - добавить опцию для работы с mb string
все функции для работы со строками заменить на аналоги mb_*
базу конвертнуть, таблицы поправить.
Если временные таблицы в процессе работы создаются - указываем при создании кодировку.
Чтобы данные из базы приходили в правильной кодировке - после коннекта:
SET NAMES utf8
 

CHEM_Eugene

Новичок
Автор оригинала: Angerslave
есть ini_set('mbstring.func_overload', 1);
Я так понял, что ф-ии mb_* будут автоматически вызываться при вызове стандартных и в коде менять ничего не придется ?
Могут ли пригодиться стандартные строковые ф-ии или вместо них всегда можно использовать mb_* ?
 

Beavis

Banned
самое главное - перед тем как всё переделывать, дамп сделать, а то частенько данные портятся и их уже потом не восстановишь
 

CHEM_Eugene

Новичок
Автор оригинала: Kirill
базу конвертнуть, таблицы поправить.
Имеется ввиду перекодировать контент и поменять у самих таблиц кодировку в настройках ?

-~{}~ 11.07.08 15:17:

Автор оригинала: Beavis
самое главное - перед тем как всё переделывать, дамп сделать, а то частенько данные портятся и их уже потом не восстановишь
Данных нет, только тестовые, т.к. сайты не делались ещё на ней

-~{}~ 11.07.08 18:15:

Ещё вопрос: корректно ли работают PRCE с UTF-8 ?
 

dimagolov

Новичок
CHEM_Eugene, про кодировки мускля есть хорошая статья в FAQ, ознакомься для начала
 
Сверху