Какви знаци са еквивалентни в utf8_general_ci?

Очевидно главните и малките букви се считат за еквивалентни. Но това само за латински букви ли се отнася или за повече азбуки? гръцки и т.н.?

Кои букви с ударение се считат за еквивалентни? В немските сравнявания получавате ü равно на u или ue в зависимост от това кой използвате. Има ли такива неща в utf8_general_ci?

И докъде стига еквивалентността? И двете хирагана и катакана представляват една и съща сричка, така че считат ли се за еквивалентни в съпоставката?

Изглежда не мога да намеря никаква информация за това, което е странно, като се има предвид колко важно би трябвало да е за неща като уникални ключове...


person Niet the Dark Absol    schedule 18.06.2014    source източник


Отговори (1)


Както можете да намерите тук, "просто премахва всички ударения и след това преобразува до главни букви".

Ако искате да не проверявате това, просто използвайте utf8_unicode_ci - той не прави тези неща и също така е по-бърз. Така че, ако не ви трябва, не го използвайте!

А тези японци... наистина не знам. Но е лесно да се провери...

Източник: http://forums.mysql.com/read.php?103,187048,188748

person tensojka    schedule 19.06.2014