Кодировки файлов preg_match...

mak_sim2001

Новичок
Кодировки файлов preg_match...

Первый раз сталкиваюсь с такой проблемой(русскоязычный сайт :).

Сделал заголовок UTF-8, решил всё с базой и т.п. Всё работает вроде но...

Работаю в редакторе np++ (все файлы скриптов а их очень много в ANSI)
если я делаю вывод с базы html отбражается корректно, если я пишу русский текст в скрипте(шаблоне) он в браузере выводит - ??? ?????

так-же неработают регулярки с русскими буквами, substr() тоже работает коряво...

Я так понял что если поменять кодировки всех файлов движка на utf-8 всё будет гут.

Подскажите плиз правильно ли я понял проблему и с помощью чего лучше менять кодировки фаилов?

-~{}~ 24.03.08 00:08:

P.S. В какой кодировке лучше делать utf-8 или windows-1251 выбрал utf-8 так как у хостёра по дефолту бд в utf-8?
 

mak_sim2001

Новичок
Подскажите плиз правильно ли я понял проблему?
по поводу менюшек...

Format->Uncode in utf-8 только лажа получается у меня если в Far просмотреть в начало файла "метка" - п>ї добовляется... блин у меня ошибка соответсвеноо вылетает
"Cannot modify header information - headers already sent by..."
 

Scud

Новичок
Это BOM mark, наверняка где-нибудь есть настройка чтобы она не добавлялась.
 

mak_sim2001

Новичок
Короче я сделал так: поменял кодировки всех файлов в np++, добавил во всех скриптах комментари на русском в utf-8 и удалил эти самые BOM mark в FAR. Подключил mb_string спасибо Mr_Maxу. Всё работает, но есть осадок что делал всё не так как надо...

Кстати о регулярках в класс [а-я] почему-то непопадают буквы от "р" до "ю" включительно это всё таки кривые руки или они в utf-8 "идут не по порядку"?
 

alexcrown

Новичок
Раз уж подключили mb_string, то освойте регулярки из него. Они с utf8 работают процентов на 30-40 быстрее чем pcre и в целом совместимы с ним.
 
Сверху