Как правильно хранить различные кодировки в одной базе?

dadoc

Новичок
Иван 76
Хочу развеять миф об увеличении данных в два раза. Для русских букв это действительно так, в UTF-8 они требуют два байта. А в английском, французском, немецком и прочих европейских языках большинство букв не отличаются от латинских и занимают один байт. Так что при конвертации этих текстов в UTF-8, не думаю, что объем увеличится более чем на 5-10%.
 

Иван 76

Новичок
Автор оригинала: .des.
[offtop]Иван 76, Апельсин - это она.

-~{}~ 06.07.07 00:39:

Ниче я так опоздал :D
Приношу свои извинения. Вдвойне приятно получить толковый совет от девушки.

-~{}~ 06.07.07 20:08:

Автор оригинала: Wicked
и вот еще интересный материал
http://www.phpwact.org/php/i18n/utf-8
Спасибо. Хороший материал

-~{}~ 06.07.07 20:12:

Автор оригинала: Wicked
а выводить прямо в утф8 религия не позволяет?
Можно, если бы я об этом задумался в самом начале. Сейчас уже сильно много кода нужно править.

-~{}~ 06.07.07 20:15:

Про http://lv.php.net/manual/en/ref.mbstring.php не слышали?
Об этом и речь. По мгновению волшебной палочки само по себе все не заменится.
В программе 2500 файлов, 13 Мб.
Много правок требуется.

-~{}~ 06.07.07 20:19:

В общем, ОГРОМНОЕ ВСЕМ СПАСИБО. И Парням, и ДЕВУШКАМ.
Я редко обращаюсь за советом, но всегда приятно общаться с ПРОФЕССИОНАЛАМИ.
 

.des.

Поставил пиво кому надо ;-)
Автор оригинала: Иван 76
-~{}~ 06.07.07 20:15:
Об этом и речь. По мгновению волшебной палочки само по себе все не заменится.
В программе 2500 файлов, 13 Мб.
Много правок требуется.
А вы все таки прочитайте внимательно.
В частности это: http://lv.php.net/manual/en/ref.mbstring.php#mbstring.overload
 

jonjonson

Охренеть
Это же каково качество кода, если править везде?
В таком случае после рефакторинга 4.5 Мб останется...
 

direqtor

Новичок
Просто есть еще национальные поисковики, которые не юзают утф. К примеру, китайские.
Будет точная инфа, что все поддерживают его - выкину всякие win, gb, iso нафик. :)
 

Иван 76

Новичок
Автор оригинала: .des.

А вы все таки прочитайте внимательно.
В частности это: http://lv.php.net/manual/en/ref.mbstring.php#mbstring.overload
В принципе, - выход. Спасибо. Я сразу не разобрался. Нужно подумать. Может быть и стоит перескочить на UTF.
Скажу больше: ОЧЕНЬ ЦЕННАЯ ИНФОРМАЦИЯ.

-~{}~ 07.07.07 20:50:

Автор оригинала: jonjonson
Это же каково качество кода, если править везде?
В таком случае после рефакторинга 4.5 Мб останется...
Слезь с коня, не будь скотиной. Ничего, кроме своего дилетантства ты этим не показал. Форум - место для обмена опытом, а не для того чтобы умничать и мусорить в нем пустыми сообщениями.
В отличии от тебя, есть люди, которые дело говорят. Учись у него
http://phpclub.ru/talk/showthread.php?postid=728531#post728531

По крайне мере он знает то, о чем ты и не догадываешься. Теперь и я знаю. Потому что прихожу сюда ради знаний, а не ради того, чтоб умничать и мусорить. А ты как знал мало, так и будешь знать мало, и давать бестолковые посты будешь.
А может ты создаешь абстрактные слои для substr()???

-~{}~ 07.07.07 21:00:

Автор оригинала: Luerssen
Извращение:

Хранить коды символов + кодировку =)
Вообще-то, я встречал такой подход в одном морфологическом модуле. И там это было очень кстати. Но здесь - другая ситуация, сами понимаете.
 

jonjonson

Охренеть
Иван 76, уж больно ты грозен, как я погляжу :)
На самом деле когда возникает вопрос об улучшении кода, а ты отвечаешь о коде в мегобайтах, то это для грамотного программиста значит одно... В наличии уже не изменяемый говнокод, с которым лучше не иметь дел вообще. Либо засесть за рефакторинг, но кто же за это заплатит?

Насчёт твоего неправильного отношения к UTF-8 я раньше всех отметил, да не в том суть. Главное, что бы ты сам понял, что все костыли, которые ты изобретал, тебе не помогут ;)
Я не собирался и не собираюсь разрушать твои религиозные верования в костыли. Тем более, что при работе с UTF-8 они тоже могут иногда возникнуть. Могу отметить одно, что нужно выбирать путь с меньшим количеством костылей. :)
 

Иван 76

Новичок
Автор оригинала: jonjonson
Иван 76, уж больно ты грозен, как я погляжу :)
На самом деле когда возникает вопрос об улучшении кода, а ты отвечаешь о коде в мегобайтах, то это для грамотного программиста значит одно... В наличии уже не изменяемый говнокод, с которым лучше не иметь дел вообще. Либо засесть за рефакторинг, но кто же за это заплатит?

Насчёт твоего неправильного отношения к UTF-8 я раньше всех отметил, да не в том суть. Главное, что бы ты сам понял, что все костыли, которые ты изобретал, тебе не помогут ;)
Я не собирался и не собираюсь разрушать твои религиозные верования в костыли. Тем более, что при работе с UTF-8 они тоже могут иногда возникнуть. Могу отметить одно, что нужно выбирать путь с меньшим количеством костылей. :)
Ну вот видишь, я же говорил, что давать бестолковые посты будешь. Но ты оказался быстрее в этом вопросе, чем я ожидал.

>На самом деле когда возникает вопрос об улучшении кода
Ты даже не знаешь тему топика, в который постишь. Ну это, у кого что болит. Значит у тебя УЛУЧШЕНИЕ - больная тема.
Вопрос об улучшении кода вообще не стоял, и не навязывай свои мысли другим.

>Насчёт твоего неправильного отношения к UTF-8
Ваше больное воображение, и только.

Вывод:
Как я уже и говорил, ничего, кроме бестолкового мусора ты сюда не добавил. И про UTF ты знаешь гораздо меньше, чем другие участники этого топика - ФАКТ. Факт в том, что другие посты умнее и дельные, и по сути вопроса.

Резюме:
Внимательно читайте http://phpclub.ru/talk/showthread.php?postid=728721#post728721 избавляетесь от паранойи и умейте. Уважайте время других, раз своего не жалко, не отвлекайте внимание других мусором и бестолковщиной, и учитесь привлекать себе внимание ЗНАНИЯМИ (а если их нет - то приобретайте их в этом форуме). Не нужно говорить то, о чем Вас не спрашивали. И поверьте, если встанет вопрос об оценке качества кода, Вас об этом не спросят, поскольку, как я уже говорил, есть люди УМНЕЕ, и АВТОРИТЕТНЕЕ.

Да, и смените, наконец, свое мышление на позитивное. Вы посмотрите, я вам говорю в каждом посте про ЗНАНИЯ, ПОЛЕЗНОСТЬ, ДЕЛЬНОСТЬ, ОПЫТ. В вашем же лексиконе такие слова отсутствуют, а превалируют: КОСТЫЛИ, ГОВНОКОД...

И большая просьба: НЕ НУЖНО БОЛЬШЕ МУСОРИТЬ В ЭТОМ ТОПИКЕ!!! ВЫ НЕ МОЖЕТЕ НИЧЕГО ОТВЕТИТЬ ПО СУТИ ВОПРОСА (прочтите хоть раз тему топика)!!!
Я ЖЕ ВАМ НИЧЕГО НОВОГО НЕ СКАЖУ!!! Я ВАМ И ТАК ДАЛ МНОГО ЗНАНИЙ ПО ПОВОДУ ТОГО, КАК СТАТЬ УМНЕЕ. ДЕРЗАЙТЕ. УВАЖАЙТЕ ДРУГИХ, СПРАШИВАЙТЕ, ЦЕНИТЕ ЗНАНИЯ.

Мне Вам больше нечего добавить. Если Вам мало того, что я Вам сказал - откройте топик с темой КАК МНЕ СТАТЬ УМНЕЕ. А еще лучше - читайте FAQ. Там ясно написано - знания нужно УВАЖАТЬ.
 
Сверху