Ув.
Frol , отвечаю.
Автор оригинала: Frol
уважаемый Jackyk, вы уже две недели выбираете кодировку для какого-то сайта про машины.
вам самим не кажется это странным?
Нет, не кажется. То-то и оно, что для меня это не просто "
какой-то сайт про машины". Для меня на данный момент это единственный и важнейший проект. Делаю я его не для заказчика, а для себя, делаю не на один день, а для того, чтобы он мог прочно войти в автомобильный интернет России в качестве полезного, интересного и авторитетного ресурса по новым автомобилям, а также большого сообщества.
Автор оригинала: Frol
перед выходом на улицу вы обувь также долго выбираете?
Сказанное мной про 2 недели не стоит воспринимать буквально. Это не значит, что все 2 недели я только этим и занимаюсь, не делаю больше вообще ничего, а также не ем и не сплю. Всё идет своим чередом, доводится движок, настраивается выделенный сервер и т.д..
Тем не менее, по поводу использованной Вами аналогии - да, я стараюсь принимать важные решения не методом подбрасывания монеты, а методом изучения сабжа и осознанным выбором.
Автор оригинала: Frol
почему вы ищите какой-то тайный смысл юникода?
Потому, что это решение надо принять сейчас, и потому, что потом не так просто будет исправить последствия ошибочно принятого решения.
И, похоже, "тайный смысл" искался всё же не зря. Уже после открытия этой темы мне стал известен первый
реальный пример, когда различие действительно может иметь последствия.
Вкратце: существует удобный и бесплатный плагин к нашей CMS, расширенный поиск на основе
Lucene. Как сообщил мне разработчик, данный плагин весь backend хранит в UTF-8. По его словам, это делает Unicode фактически незаменимым для использования данного плагина. Не знаю уж, сколь применимо тут слово "незаменимый", наверное, можно как-то и конвертить на лету, но даже если заменить "незаменимый" на "более желательный", "более корректно работающий", или просто "готовый к работе без напильника" - это уже очень важный фактор. Похоже, что использование западного софта и западных к нему плагинов делает выбор Unicode более правильным, нежели windows-1251, так как контент в Unicode будет однозначно совместим со всем, а вот контент в windows-1251 может показывать некорректную работу либо невозможность использования тех или других важных вещей без дополнительной доработки, а я не программист.
Если можно, пара вопросов к тем, кто знает.
1. Какое значения collation лучше выбрать для MySQL - utf8_general_ci или utf8_unicode_ci? Чем они отличаются, я знаю, но не знаю, сколь принципиальны эти отличия, и как влияет выбор расширенной кодировки utf8_unicode_ci на серверную нагрузку.
2. Если выбрал одно из них, а потом выяснилось, что выбрал неверно, насколько просто/сложно потом поменять collation? Тоже перекодировка всей базы, или всё проще?
Спасибо.
С уважением, Евгений.