Какие символы эквивалентны в utf8_general_ci?

Очевидно, что прописные и строчные буквы считаются эквивалентными. Но относится ли это только к латинским символам или к большему количеству алфавитов? Греческий и т.д.?

Какие буквы с ударением считаются эквивалентными? В немецких сопоставлениях вы получаете ü равным u или ue в зависимости от того, какой из них вы используете. Есть ли такие вещи в utf8_general_ci?

И насколько далеко заходит эквивалентность? И хирагана , и катакана представляют один и тот же слог, поэтому считаются ли они эквивалентными при сопоставлении?

Кажется, я не могу найти никакой информации об этом, что странно, учитывая, насколько это важно для таких вещей, как уникальные ключи...


person Niet the Dark Absol    schedule 18.06.2014    source источник


Ответы (1)


Как вы можете найти здесь, "он просто удаляет все акценты, а затем преобразует в верхний регистр».

Если вы хотите не проверять это, просто используйте utf8_unicode_ci — он не делает этого и к тому же работает быстрее. Так что, если вам это не нужно, не используйте его!

А эти японцы... Я правда не знаю. Но это легко проверить...

Источник: http://forums.mysql.com/read.php?103,187048,188748

person tensojka    schedule 19.06.2014