Кинотавр
Новичок
Как обрабатывать строку после поста в кодировке iso-8859-1
В проекте используется кодировка "iso-8859-1".
Пишется форум, сохраняющий всё в текстовых файлах. При постинге текст обрабатывается при помощи htmlspecialchars. В результате русские буквы сохраняются в виде "к"
Мне надо, чтобы сохранялись как минимум в виде "к".
А лучше чтобы вообще по-нормальному - как буквы ("к" в данном случае).
Эксперименты показали, что:
1. Если убрать htmlspecialchars, то буквы сохраняются приемлемо - в виде "к", но это вариант не подходит, так как тогда все тэги будут открыты для юзеров.
2. Если оставить htmlspecialchars, но сменить кодировку на русскую "windows-1251", то буквы сохраняются как надо - все нормально. Но такая кодировка неприемлема, так как проект иностранный.
На самом деле, естественно, иностранцы будут использовать не русские буквы, а те, которые им полагаются - с разными умляутами и другими прибамбасами. Но в нашем случае, это русские буквы.
Итак, вопрос.
Как сделать, чтобы при кодировке "iso-8859-1" можно было и отсекать тэги, и сохранять русские буквы в корректном, отображаемом виде.
Спасибо.
В проекте используется кодировка "iso-8859-1".
Пишется форум, сохраняющий всё в текстовых файлах. При постинге текст обрабатывается при помощи htmlspecialchars. В результате русские буквы сохраняются в виде "к"
Мне надо, чтобы сохранялись как минимум в виде "к".
А лучше чтобы вообще по-нормальному - как буквы ("к" в данном случае).
Эксперименты показали, что:
1. Если убрать htmlspecialchars, то буквы сохраняются приемлемо - в виде "к", но это вариант не подходит, так как тогда все тэги будут открыты для юзеров.
2. Если оставить htmlspecialchars, но сменить кодировку на русскую "windows-1251", то буквы сохраняются как надо - все нормально. Но такая кодировка неприемлема, так как проект иностранный.
На самом деле, естественно, иностранцы будут использовать не русские буквы, а те, которые им полагаются - с разными умляутами и другими прибамбасами. Но в нашем случае, это русские буквы.
Итак, вопрос.
Как сделать, чтобы при кодировке "iso-8859-1" можно было и отсекать тэги, и сохранять русские буквы в корректном, отображаемом виде.
Спасибо.