MySQL Collation名称遵循以下约定:
排序规则名称以与之关联的字符集的名称开始,通常后跟一个或多个后缀,指示其他排序规则特征。例如,
UTF8MB4_0900_AI_CI.
和latin1_swedish_ci.
是融合的UTF8MB4.
和拉丁语
字符集分别。这二进制
字符集有一个整理,也命名二进制
,没有后缀。特定于语言的归属包括区域设置代码或语言名称。例如,
UTF8MB4_TR_0900_AI_CI.
和UTF8MB4_HU_0900_AI_CI.
排序字符UTF8MB4.
使用土耳其语和匈牙利语的规则集。utf8mb4_turkish_ci.
和UTF8MB4_HUNGARIAN_CI.
是类似的,但基于最近的Unicode归类算法的版本。整理后缀表示排序规则是区分大小写的,口腔敏感的或kana敏感(或其某种组合),或二进制。下表显示了用于表示这些特征的后缀。
对于未指定重音敏感性的非线性核对名称,它是通过案例灵敏度来确定的。如果排序规则不包含
_AI.
或者_作为
那_CI.
以名称意味着_AI.
和_CS
以名称意味着_作为
。例如,latin1_general_ci.
明确差不多,无敏感,无晕,latin1_general_cs.
明确区分敏感和隐含的口音敏感,并且UTF8MB4_0900_AI_CI.
明确的不敏感和口气不敏感。对于日本的集合,
_ks.
后缀表示排序规则是kana敏感的;也就是说,它将卡塔卡纳字符与平假名字符区分开来。日本集团没有_ks.
后缀不是kana敏感的和治疗卡塔卡纳和平假名字符等同于排序。为了
二进制
束缚二进制
字符集,比较基于数字字节值。为了_BIN.
非边区字符集的归一组合,比较基于数字字符代码值,它与多字节字符的字节值不同。有关差异之间的信息二进制
束缚二进制
字符集和_BIN.
非加入字符集的拼写,见第10.8.5节“二进制排列与_bin集合相比”。Unicode字符集的核对名称可以包括版本号,以指示排序规则所基于的Unicode归类算法(UCA)的版本。基于UCA的整理,没有名称中的版本号使用版本-4.0.0 UCA权重键。例如:
UTF8MB4_0900_AI_CI.
基于UCA 9.0.0重量键(http://www.unicode.org/public/uca/9.0.0/allkeys.txt.)。UTF8MB4_UNICODE_520_CI.
基于UCA 5.2.0重量键(http://www.unicode.org/public/uca/5.2.0/allkeys.txt.)。UTF8MB4_UNICODE_CI.
(没有版本名为)基于UCA 4.0.0重量键(http://www.unicode.org/public/uca/4.0.0/allkeys-4.0.0.0.txt.xt.)。
对于Unicode字符集,
整理保留了原始的5.1.24次订购XXX.
_general_mysql500_ci.
在MySQL 5.1.24(Bug#27877)之前创建的表格和许可升级。XXX.
_general_ci.