ES的ID区分大小写,如果存放mysql,自动应该用ai_cs,搜索更准确

2023-06-27

mysql创建表时, 字符集需要设置"编码集(charset)"和"校验规则(collation)"。 编码集比较常用的有utf8和utf8mb4, 校验规则比较常用的是utf8mb4_0900_ai_ci, utf8mb4_0900_as_cs, utf8mb4_bin;


utf8: 不是普遍意义上的utf8编码, 会有部分普遍意义的utf8字符不能正常显示


utf8mb4: 真正意义上的utf8编码, 可以显示所有普遍意义的utf8字符. 


utf8mb4_0900_ai_ci: 对大小写不敏感, 以"_ci"结尾的表示对大小写不敏感, 该模式下字符 'a'等于字符'A'


utf8mb4_0900_as_cs: 对大小写敏感, 以"_cs"结尾的表示对大小写敏感, 该模式下字符 'a'不等于字符'A'


utf8mb4_bin: 是基于字符编码值得对比, 与使用的语言无关, 也是是大小写敏感的.