国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數據庫 > MySQL > 正文

mysql的校對規則引起的問題分析

2024-07-24 13:04:11
字體:
來源:轉載
供稿:網友
問題是這樣的:
一張test的表,字符集采用的latin1。
select to_id from test where to_id='cn象_王';
+---------------+
| to_id |
+---------------+
| cn陶_陶 |
| cn象_王 |
+---------------+
2 rows in set (0.00 sec)

取cn象_王的數據,居然把cn陶_陶的數據也取回來了。

這顯然是不允許的。

查看它們的編碼:
(root@im_offlog1a:)[test]> select hex('cn陶_陶');
+----------------+
| hex('cn陶_陶') |
+----------------+
| 636ECCD55FCCD5 |
+----------------+
1 row in set (0.00 sec)
(root@im_offlog1a:)[test]> select hex('cn象_王');
+----------------+
| hex('cn象_王') |
+----------------+
| 636ECFF35FCDF5 |
+----------------+
1 row in set (0.00 sec)
編碼的確是不一樣的,但是為什么mysql會認為這兩條記錄是一樣的呢?
一開始我們就把問題定位于collation引起的問題。
show variables查看
| collation_connection | latin1_swedish_ci
| collation_database | latin1_swedish_ci
| collation_server | latin1_swedish_ci

手工把這些參數修改為latin1_bin,結果居然一樣。這下感覺真是奇怪了。
這里先解釋一下mysql collation的命名規則:
它們以其相關的字符集名開始,通常包括一個語言名,并且以_ci(大小寫不敏感)、_cs(大小寫敏感)或_bin(二元)結束
比如latin1字符集有以下幾種校正規則:
校對規則 含義
latin1_german1_ci 德國DIN-1
latin1_swedish_ci 瑞典/芬蘭
latin1_danish_ci 丹麥/挪威
latin1_german2_ci 德國 DIN-2
latin1_bin 符合latin1編碼的二進制
latin1_general_ci 多種語言(西歐)
latin1_general_cs 多種語言(西歐ISO),大小寫敏感
latin1_spanish_ci 現代西班牙

最后我們將表格重建,手工指定表格級別的collation為latin1_bin。
這個問題就得到了解決。

那么問題又來了,為什么我前面手工測試latin1_bin時不生效呢?
原來MySQL按照下面的方式選擇表字符集和 校對規則:
如果指定了CHARACTER SET X和COLLATE Y,那么采用CHARACTER SET X和COLLATE Y。
如果指定了CHARACTER SET X而沒有指定COLLATE Y,那么采用CHARACTER SET X和CHARACTER SET X的默認校對規則。
否則,采用服務器字符集和服務器校對規則。
而我們在建表的時候指定了character set,所以它永遠是采用對應的默認的校對規則。

當然我們其實也沒必要重建表格,只需要alter table db_allot CONVERT TO CHARACTER SET latin1 COLLATE latin1_bin這樣轉換即可。


另外建議collation都盡量采用字符集相應的bin類型的校對規則,這樣不容易出錯
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 兴城市| 太谷县| 绥阳县| 澜沧| 福鼎市| 威海市| 织金县| 云南省| 汨罗市| 招远市| 惠安县| 桦甸市| 昔阳县| 阆中市| 蓬安县| 三都| 自治县| 乌鲁木齐市| 博白县| 新宾| 古交市| 察雅县| 龙口市| 图们市| 隆化县| 布拖县| 康保县| 富阳市| 冷水江市| 宜兰县| 台北市| 正宁县| 射洪县| 钟山县| 清河县| 苍梧县| 喜德县| 麻城市| 旬阳县| 沁源县| 通辽市|