Как обрабатывать строку после поста в кодировке iso-8859-1

Кинотавр · 21 Июн 2003

Как обрабатывать строку после поста в кодировке iso-8859-1

В проекте используется кодировка "iso-8859-1".
Пишется форум, сохраняющий всё в текстовых файлах. При постинге текст обрабатывается при помощи htmlspecialchars. В результате русские буквы сохраняются в виде "&amp;#1082;"
Мне надо, чтобы сохранялись как минимум в виде "&#1082;".
А лучше чтобы вообще по-нормальному - как буквы ("к" в данном случае).

Эксперименты показали, что:
1. Если убрать htmlspecialchars, то буквы сохраняются приемлемо - в виде "&#1082;", но это вариант не подходит, так как тогда все тэги будут открыты для юзеров.
2. Если оставить htmlspecialchars, но сменить кодировку на русскую "windows-1251", то буквы сохраняются как надо - все нормально. Но такая кодировка неприемлема, так как проект иностранный.

На самом деле, естественно, иностранцы будут использовать не русские буквы, а те, которые им полагаются - с разными умляутами и другими прибамбасами. Но в нашем случае, это русские буквы.

Итак, вопрос.
Как сделать, чтобы при кодировке "iso-8859-1" можно было и отсекать тэги, и сохранять русские буквы в корректном, отображаемом виде.

Спасибо.

tony2001 · 21 Июн 2003

версия РНР - ?

Кинотавр · 21 Июн 2003

PHP Version 4.3.0

Уважаемый tony2001, перечитайте еще раз сообщение, я его отредактировал, так как некоторые символы там выводились не так как, я задумывал.

tony2001 · 21 Июн 2003

попробуйте обновить до 4.3.2
в этой версии работа htmlentities & htmlspecialchars с русским языком была улучшена.

p.s. я сразу заглянул в сорцы постинга =)

Как обрабатывать строку после поста в кодировке iso-8859-1

Кинотавр

Новичок

tony2001

TeaM PHPClub

Кинотавр

Новичок

tony2001

TeaM PHPClub