一、背景
以前使用SQL Server進行表分區的時候就碰到很多關于唯一索引的問題:Step8:SQL Server 當表分區遇上唯一約束,沒想到在MySQL的分區中一樣會遇到這樣的問題:MySQL表分區實戰。
今天我們來了解MySQL唯一索引的一些知識:包括如何創建,如何批量插入,還有一些技巧上SQL;
這些問題的根源在什么地方?有什么共同點?MySQL中也有分區對齊的概念?唯一索引是在很多系統中都會出現的要求,有什么辦法可以避免?它對性能的影響有多大?
二、過程
(一) 導入差異數據,忽略重復數據,IGNORE INTO的使用
在MySQL創建表的時候,我們通常創建一個表的時候是以一個自增ID值作為主鍵,那么MySQL就會以PRIMARY KEY作為聚集索引鍵和主鍵,既然是主鍵,那當然是唯一的了,所以重復執行下面的插入語句會報1062錯誤:如Figure1所示;

(Figure1:Duplicate entry '1' for key 'PRIMARY')
但是在實際的生產環境中,需求往往是需要在UserId鍵值中設置唯一索引,今天我就以這個作為示例,進行唯一索引的測試:

(Figure2:testtable1記錄)

(Figure3:testtable2記錄)
通過執行上面的SQL腳本,我們在testtable1和testtable2都創建了唯一索引:UNIQUE KEY `IX_UserId` (`UserId`),這就說明UserId在testtable1和testtable2表中都是唯一的,如果把testtable2的數據批量導入到testtable1,如果執行下面【導入1】的SQL,就會出現1062的錯誤,導致整個過程會回滾,沒有達到導入差異數據的目的。

(Figure4:Duplicate entry '101' for key 'IX_UserId')
MySQL提供一個關鍵字:IGNORE,這個關鍵字判斷每條記錄是否存在,是否違反餓了表中的唯一索引,如果存在就不插入,而不存在的記錄就會插入。

(Figure5:IGNORE效果)
(二) 導入并覆蓋重復數據,REPLACE INTO 的使用
1. 把testtable1和testtable2分別回滾到Figure2和Figure3的狀態(使用TRUNCATE TABLE命名再執行Insert語句),這個時候再執行下面的SQL,看有什么效果:

(Figure6:REPLACE效果)
從上圖Figure6中,我們可以看到:UserId為101的記錄發生了改變,不單UserName修改了,而且UserType也變為NULL了。
所以,如果導入中發現了重復的,先刪除再插入,如果記錄有多個字段,在插入的時候如果有的字段沒有賦值,那么新插入的記錄這些字段為空(新插入記錄的UserType都為NULL)。
需要注意的是,當你replace的時候,如果被插入的表如果沒有指定列,會用NULL表示,而不是這個表原來的內容。如果插入的內容列和被插入的表列一樣,則不會出現NULL。
2. 如果我們表結構UserType字段不允許為空,而且沒有默認值的情況,執行【導入3】會發生什么事情呢?

(Figure7:返回警告信息)

(Figure8:UserType被設置為0)
通過Figure7和Figure8,我們知道數據記錄還是插入了,只是返回Field 'UserType' doesn't have a default value的警告,插入記錄的UserType字段都被設置為0('UserType' 為int數據類型)。
3. 如果我們希望導入的時候一起更新UserType字段的值,這自然很簡單了,使用下面的SQL腳本就可以解決:

(Figure9:一起更新UserType)
(三) 導入保留重復數據未指定字段,INSERT INTO ON DUPLICATE KEY UPDATE 的使用
把testtable1和testtable2分別回滾到Figure2和Figure3的狀態(使用TRUNCATE TABLE命名再執行Insert語句),這個時候再執行下面的SQL,看有什么效果:

(Figure10:保留UserType值)
對比Figure2、Figure3與Figure10,UserId為101的記錄:更新了UserName的值,保留了UserType的值;但是由于【導入5】中沒有指定UserType,所以新插入記錄的UserType是為NULL的。

(Figure11:保留UserType值)
對比Figure2、Figure3與Figure11,只插入testtable2表的UserId,UserName字段,但是保留testtable1表的UserType字段。如果發現有重復的記錄,做更新操作;在原有記錄基礎上,更新指定字段內容,其它字段內容保留。
(四) 總結
當在一個UNIQUE鍵上插入包含重復值的記錄時,默認的insert會報1062錯誤,MYSQL可以通過以上三種不同的方式和你的業務邏輯進行處理。
三、參考文獻
新聞熱點
疑難解答