假如我們創建了一個testindex表:
create table testindex(i_testid int not null,vc_name varchar(16) not null);
我們隨機向里面插入了1000條記錄,其中有一條
i_testid vc_name
555 erquan
在查找vc_name="erquan"的記錄
select * from testindex where vc_name='erquan';
時,如果在vc_name上已經建立了索引,mysql無須任何掃描,即準確可找到該記錄!相反,mysql會掃描所有記錄,即要查詢1000次啊~~可以索引將查詢速度提高100倍。
一、索引分單列索引和組合索引
單列索引:即一個索引只包含單個列,一個表可以有多個單列索引,但這不是組合索引。
組合索引:即一個索包含多個列。
二、介紹一下索引的類型
1.普通索引。
這是最基本的索引,它沒有任何限制。它有以下幾種創建方式:
(1)創建索引:create index indexname on tablename(tablecolumns(length));如果是char,varchar類型,length可以小于字段實際長度;如果是blob 和 text 類型,必須指定length,下同。
(2)修改表結構:alter tablename add index [indexname] on (tablecolumns(length))
(3)創建表的時候直接指定:create table tablename ( [...], index [indexname] (tablecolumns(length)) ;
2.唯一索引。
它與前面的"普通索引"類似,不同的就是:索引列的值必須唯一,但允許有空值。如果是組合索引,則列值的組合必須唯一。它有以下幾種創建方式:
(1)創建索引:create unique index indexname on tablename(tablecolumns(length))
(2)修改表結構:alter tablename add unique [indexname] on (tablecolumns(length))
(3)創建表的時候直接指定:create table tablename ( [...], unique [indexname] (tablecolumns(length));
3.主鍵索引
它是一種特殊的唯一索引,不允許有空值。一般是在建表的時候同時創建主鍵索引:create table testindex(i_testid int not null auto_increment,vc_name varchar(16) not null,primary key(i_testid)); 當然也可以用alter命令。
記住:一個表只能有一個主鍵。
4.全文索引
mysql從3.23.23版開始支持全文索引和全文檢索。這里不作討論,呵呵~~
刪除索引的語法:drop index index_name on tablename
三、單列索引和組合索引
為了形象地對比兩者,再建一個表:
create table myindex ( i_testid int not null auto_increment, vc_name varchar(50) not null, vc_city varchar(50) not null, i_age int not null, i_schoolid int not null, primary key (i_testid) );
在這10000條記錄里面7上8下地分布了5條vc_name="erquan"的記錄,只不過city,age,school的組合各不相同。
來看這條t-sql:
select i_testid from myindex where vc_name='erquan' and vc_city='鄭州' and i_age=25;
首先考慮建單列索引:
在vc_name列上建立了索引。執行t-sql時,mysql很快將目標鎖定在了vc_name=erquan的5條記錄上,取出來放到一中間結果集。在這個結果集里,先排除掉vc_city不等于"鄭州"的記錄,再排除i_age不等于25的記錄,最后篩選出唯一的符合條件的記錄。
雖然在vc_name上建立了索引,查詢時mysql不用掃描整張表,效率有所提高,但離我們的要求還有一定的距離。同樣的,在vc_city和i_age分別建立的單列索引的效率相似。
為了進一步榨取mysql的效率,就要考慮建立組合索引。就是將vc_name,vc_city,i_age建到一個索引里:
alter table myindex add index name_city_age (vc_name(10),vc_city,i_age);--注意了,建表時,vc_name長度為50,這里為什么用10呢?因為一般情況下名字的長度不會超過10,這樣會加速索引查詢速度,還會減少索引文件的大小,提高insert的更新速度。
執行t-sql時,mysql無須掃描任何記錄就到找到唯一的記錄!!
肯定有人要問了,如果分別在vc_name,vc_city,i_age上建立單列索引,讓該表有3個單列索引,查詢時和上述的組合索引效率一樣吧?嘿嘿,大不一樣,遠遠低于我們的組合索引~~雖然此時有了三個索引,但mysql只能用到其中的那個它認為似乎是最有效率的單列索引。
建立這樣的組合索引,其實是相當于分別建立了
vc_name,vc_city,i_age
vc_name,vc_city
vc_name
這樣的三個組合索引!為什么沒有vc_city,i_age等這樣的組合索引呢?這是因為mysql組合索引"最左前綴"的結果。簡單的理解就是只從最左面的開始組合。并不是只要包含這三列的查詢都會用到該組合索引,下面的幾個t-sql會用到:
select * from myindex whree vc_name="erquan" and vc_city="鄭州"
select * from myindex whree vc_name="erquan"
而下面幾個則不會用到:
select * from myindex whree i_age=20 and vc_city="鄭州"
select * from myindex whree vc_city="鄭州"
四、使用索引
到此你應該會建立、使用索引了吧?但什么情況下需要建立索引呢?一般來說,在where和join中出現的列需要建立索引,但也不完全如此,因為mysql只對 <,<=,=,>,>=,between,in,以及某些時候的like(后面有說明)才會使用索引。
select t.vc_name from testindex t left join myindex m on t.vc_name=m.vc_name where m.i_age=20 and m.vc_city='鄭州' 時,有對myindex表的vc_city和i_age建立索引的需要,由于testindex表的vc_name開出現在了join子句中,也有對它建立索引的必要。
剛才提到了,只有某些時候的like才需建立索引?是的。因為在以通配符 % 和 _ 開頭作查詢時,mysql不會使用索引,如
select * from myindex where vc_name like'erquan%'
會使用索引,而
select * from myindex wheret vc_name like'%erquan'
就不會使用索引了。
五、索引的不足之處
上面說了那么多索引的好話,它真的有像傳說中那么優秀么?當然會有缺點了。
1.雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對表進行insert、update和delete。因為更新表時,mysql不僅要保存數據,還要保存一下索引文件
2.建立索引會占用磁盤空間的索引文件。一般情況這個問題不太嚴重,但如果你在一個大表上創建了多種組合索引,索引文件的會膨脹很快。
篇尾:
講了這么多,無非是想利用索引提高數據庫的執行效率。不過索引只是提高效率的一個因素。如果你的mysql有大數據的表,就需要花時間研究建立最優秀的索引或優化查詢語句。
新聞熱點
疑難解答