MySQL查詢(xún)優(yōu)化系列講座之?dāng)?shù)據(jù)類(lèi)型與效率

2024-07-24 12:40:00

字體：大中小

供稿：網(wǎng)友

　　這一部分提供了如何選擇數(shù)據(jù)類(lèi)型來(lái)幫助提高查詢(xún)運(yùn)行速度的一些指導(dǎo)：

　　在可以使用短數(shù)據(jù)列的時(shí)候就不要用長(zhǎng)的。如果你有一個(gè)固定長(zhǎng)度的CHAR數(shù)據(jù)列，那么就不要讓它的長(zhǎng)度超出實(shí)際需要。如果你在數(shù)據(jù)列中存儲(chǔ)的最長(zhǎng)的值有40個(gè)字符，就不要定義成CHAR(255)，而應(yīng)該定義成CHAR(40)。如果你能夠用MEDIUMINT代替BIGINT，那么你的數(shù)據(jù)表就小一些（磁盤(pán)I/O少一些），在計(jì)算過(guò)程中，值的處理速度也快一些。如果數(shù)據(jù)列被索引了，那么使用較短的值帶來(lái)的性能提高更加顯著。不僅索引可以提高查詢(xún)速度，而且短的索引值也比長(zhǎng)的索引值處理起來(lái)要快一些。

　　如果你可以選擇數(shù)據(jù)行的存儲(chǔ)格式，那么應(yīng)該使用最適合存儲(chǔ)引擎的那種。對(duì)于MyISAM數(shù)據(jù)表，最好使用固定長(zhǎng)度的數(shù)據(jù)列代替可變長(zhǎng)度的數(shù)據(jù)列。例如，讓所有的字符列用CHAR類(lèi)型代替VARCHAR類(lèi)型。權(quán)衡得失，我們會(huì)發(fā)現(xiàn)數(shù)據(jù)表使用了更多的磁盤(pán)空間，但是如果你能夠提供額外的空間，那么固定長(zhǎng)度的數(shù)據(jù)行被處理的速度比可變長(zhǎng)度的數(shù)據(jù)行要快一些。對(duì)于那些被頻繁修改的表來(lái)說(shuō)，這一點(diǎn)尤其突出，因?yàn)樵谀切┣闆r下，性能更容易受到磁盤(pán)碎片的影響。

　　? 在使用可變長(zhǎng)度的數(shù)據(jù)行的時(shí)候，由于記錄長(zhǎng)度不同，在多次執(zhí)行刪除和更新操作之后，數(shù)據(jù)表的碎片要多一些。你必須使用OPTIMIZE TABLE來(lái)定期維護(hù)其性能。固定長(zhǎng)度的數(shù)據(jù)行沒(méi)有這個(gè)問(wèn)題。

　　? 如果出現(xiàn)數(shù)據(jù)表崩潰的情況，那么數(shù)據(jù)行長(zhǎng)度固定的表更容易重新構(gòu)造。使用固定長(zhǎng)度數(shù)據(jù)行的時(shí)候，每個(gè)記錄的開(kāi)始位置都可以被檢測(cè)到，因?yàn)檫@些位置都是固定記錄長(zhǎng)度的倍數(shù)，但是使用可變長(zhǎng)度數(shù)據(jù)行的時(shí)候就不一定了。這不是與查詢(xún)處理的性能相關(guān)的問(wèn)題，但是它一定能夠加快數(shù)據(jù)表的修復(fù)速度。

　　盡管把MyISAM數(shù)據(jù)表轉(zhuǎn)換成使用固定長(zhǎng)度的數(shù)據(jù)列可以提高性能，但是你首先需要考慮下面一些問(wèn)題：

　　? 固定長(zhǎng)度的數(shù)據(jù)列速度較快，但是占用的空間也較大。CHAR(n)列的每個(gè)值（即使是空值）通常占n個(gè)字符，這是因?yàn)榘阉鎯?chǔ)到數(shù)據(jù)表中的時(shí)候，會(huì)在值的后面添加空格。VARCHAR(n)列占有的空間較小，因?yàn)橹恍枰峙浔匾淖址麄€(gè)數(shù)用于存儲(chǔ)值，加上一兩個(gè)字節(jié)來(lái)存儲(chǔ)值的長(zhǎng)度。因此，在CHAR和VARCHAR列之間進(jìn)行選擇的時(shí)候，實(shí)際上是時(shí)間與空間的對(duì)比。如果速度是主要的考慮因素，那么就使用CHAR數(shù)據(jù)列獲取固定長(zhǎng)度列的性能優(yōu)勢(shì)。如果空間很重要，那么就使用VARCHAR數(shù)據(jù)列。總而言之，你可以認(rèn)為固定長(zhǎng)度的數(shù)據(jù)行可以提高性能，雖然它占用了更大的空間。但是對(duì)于某些特殊的應(yīng)用程序，你可能希望使用兩種方式來(lái)實(shí)現(xiàn)某個(gè)數(shù)據(jù)表，然后運(yùn)行測(cè)試來(lái)決定哪種情況符合應(yīng)用程序的需求。

　　? 即使愿意使用固定長(zhǎng)度類(lèi)型，有時(shí)候你也沒(méi)有辦法使用。例如，長(zhǎng)于255個(gè)字符的字符串就無(wú)法使用固定長(zhǎng)度類(lèi)型。

　　MEMORY數(shù)據(jù)表目前都使用固定長(zhǎng)度的數(shù)據(jù)行存儲(chǔ)，因此無(wú)論使用CHAR或VARCHAR列都沒(méi)有關(guān)系。兩者都是作為CHAR類(lèi)型處理的。

　　對(duì)于InnoDB數(shù)據(jù)表，內(nèi)部的行存儲(chǔ)格式?jīng)]有區(qū)分固定長(zhǎng)度和可變長(zhǎng)度列（所有數(shù)據(jù)行都使用指向數(shù)據(jù)列值的頭指針），因此在本質(zhì)上，使用固定長(zhǎng)度的CHAR列不一定比使用可變長(zhǎng)度VARCHAR列簡(jiǎn)單。因而，主要的性能因素是數(shù)據(jù)行使用的存儲(chǔ)總量。由于CHAR平均占用的空間多于VARCHAR，因此使用VARCHAR來(lái)最小化需要處理的數(shù)據(jù)行的存儲(chǔ)總量和磁盤(pán)I/O是比較好的。

　　對(duì)于BDB數(shù)據(jù)表，無(wú)論使用固定長(zhǎng)度或可變長(zhǎng)度的數(shù)據(jù)列，差別都不大。兩種方法你都可用試一下，運(yùn)行一些實(shí)驗(yàn)測(cè)試來(lái)檢測(cè)是否存在明顯的差別。

　　把數(shù)據(jù)列定義成不能為空（NOT NULL）。這會(huì)使處理速度更快，需要的存儲(chǔ)更少。它有時(shí)候還簡(jiǎn)化了查詢(xún)，因?yàn)樵谀承┣闆r下你不需要檢查值的NULL屬性。

　　考慮使用ENUM數(shù)據(jù)列。如果你擁有的某個(gè)數(shù)據(jù)列的基數(shù)很低（包含的不同的值數(shù)量有限），那么可以考慮把它轉(zhuǎn)換為ENUM列。ENUM值可以被更快地處理，因?yàn)樗鼈冊(cè)趦?nèi)部表現(xiàn)為數(shù)值。

　　使用PROCEDURE ANALYSE()。運(yùn)行PROCEDURE ANALYSE()可以看到數(shù)據(jù)表中列的情況：

SELECT * FROM tbl_name PROCEDURE ANALYSE();
SELECT * FROM tbl_name PROCEDURE ANALYSE(16,256);

　　輸出的每一列信息都會(huì)對(duì)數(shù)據(jù)表中的列的數(shù)據(jù)類(lèi)型提出優(yōu)化建議。第二個(gè)例子告訴PROCEDURE ANALYSE()不要為那些包含的值多于16個(gè)或者256字節(jié)的ENUM類(lèi)型提出建議。如果沒(méi)有這樣的限制，輸出信息可能很長(zhǎng)；ENUM定義通常很難閱讀。

　　根據(jù)的PROCEDURE ANALYSE()輸出信息，你可能發(fā)現(xiàn)，可以修改自己的數(shù)據(jù)表來(lái)利用那些效率更高的數(shù)據(jù)類(lèi)型。如果你決定改變某個(gè)數(shù)據(jù)列的類(lèi)型，需要使用ALTER TABLE語(yǔ)句。

　　使用OPTIMIZE TABLE來(lái)優(yōu)化那些受到碎片影響的數(shù)據(jù)表。被大量修改的數(shù)據(jù)表，特別是那些包含可變長(zhǎng)度數(shù)據(jù)列的表，容易遭受碎片的影響。碎片很糟糕，因?yàn)樗鼤?huì)導(dǎo)致用于存儲(chǔ)數(shù)據(jù)表的磁盤(pán)塊形成無(wú)用空間（空洞）。隨著時(shí)間的推移，為了得到有效的數(shù)據(jù)行，你必須讀取更多的塊，性能就會(huì)降低。這會(huì)出現(xiàn)在任何可變長(zhǎng)度的數(shù)據(jù)行上，但是對(duì)于BLOB或TEXT數(shù)據(jù)列尤其突出，因?yàn)樗鼈兊拈L(zhǎng)度差異太大了。在正常情況下使用OPTIMIZE TABLE會(huì)防止數(shù)據(jù)表的性能降低。OPTIMIZE TABLE可以用于MyISAM和BDB數(shù)據(jù)表，但是defragments只能用于MyISAM數(shù)據(jù)表。任何存儲(chǔ)引擎中的碎片整理方法都是用mysqldump來(lái)轉(zhuǎn)儲(chǔ)（dump）數(shù)據(jù)表，接著使用轉(zhuǎn)儲(chǔ)的文件刪除并重新建立那些數(shù)據(jù)表：

% mysqldump --opt db_name tbl_name > dump.sql
% mysql db_name < dump.sql

　　把數(shù)據(jù)打包放入BLOB或TEXT數(shù)據(jù)列。使用BLOB或TEXT數(shù)據(jù)列存儲(chǔ)打包（pack）的數(shù)據(jù)，并在應(yīng)用程序中進(jìn)行解包（unpack），使你能夠在一次檢索操作中得到需要的任何信息，而不需要進(jìn)行多次檢索。它對(duì)那些很難用標(biāo)準(zhǔn)的數(shù)據(jù)表結(jié)構(gòu)表現(xiàn)的數(shù)據(jù)值和頻繁變化的數(shù)據(jù)值也是有幫助的。

　　解決這個(gè)問(wèn)題的另一種方法是讓那些處理Web窗體的應(yīng)用程序把數(shù)據(jù)打包成某種數(shù)據(jù)結(jié)構(gòu)，然后把它插入到單個(gè)BLOB或TEXT數(shù)據(jù)列中。例如，你可以使用XML表示調(diào)查表回復(fù)，把那些XML字符串存儲(chǔ)在TEXT數(shù)據(jù)列中。由于要對(duì)數(shù)據(jù)進(jìn)行編碼（從數(shù)據(jù)表中檢索數(shù)據(jù)的時(shí)候還需要解碼），它會(huì)增加客戶(hù)端的開(kāi)銷(xiāo)，但是可以簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)，而且它還消除了那些因?yàn)楦淖兞苏{(diào)查表的內(nèi)容而必須改變數(shù)據(jù)表結(jié)構(gòu)的需求。

　　另一方面，BLOB和TEXT值也會(huì)引起自己的一些問(wèn)題，特別是執(zhí)行了大量的刪除或更新操作的時(shí)候。刪除這種值會(huì)在數(shù)據(jù)表中留下很大的"空洞"，以后填入這些"空洞"的記錄可能長(zhǎng)度不同（前面討論的OPTIMIZE TABLE提出解決這個(gè)問(wèn)題的一些建議）。

　　使用合成的（synthetic）索引。合成的索引列在某些時(shí)候是有用的。一種辦法是根據(jù)其它的列的內(nèi)容建立一個(gè)散列值，并把這個(gè)值存儲(chǔ)在單獨(dú)的數(shù)據(jù)列中。接下來(lái)你就可以通過(guò)檢索散列值找到數(shù)據(jù)行了。但是，我們要注意這種技術(shù)只能用于精確匹配的查詢(xún)（散列值對(duì)于類(lèi)似<或>=等范圍搜索操作符是沒(méi)有用處的）。我們可以使用MD5()函數(shù)生成散列值，也可以使用SHA1()或CRC32()，或者使用自己的應(yīng)用程序邏輯來(lái)計(jì)算散列值。請(qǐng)記住數(shù)值型散列值可以很高效率地存儲(chǔ)。同樣，如果散列算法生成的字符串帶有尾部空格，就不要把它們存儲(chǔ)在CHAR或VARCHAR列中，它們會(huì)受到尾部空格去除的影響。

　　合成的散列索引對(duì)于那些BLOB或TEXT數(shù)據(jù)列特別有用。用散列標(biāo)識(shí)符值查找的速度比搜索BLOB列本身的速度快很多。

　　在不必要的時(shí)候避免檢索大型的BLOB或TEXT值。例如，SELECT *查詢(xún)就不是很好的想法，除非你能夠確定作為約束條件的WHERE子句只會(huì)找到所需要的數(shù)據(jù)行。否則，你可能毫無(wú)目的地在網(wǎng)絡(luò)上傳輸大量的值。這也是BLOB或TEXT標(biāo)識(shí)符信息存儲(chǔ)在合成的索引列中對(duì)我們有所幫助的例子。你可以搜索索引列，決定那些需要的數(shù)據(jù)行，然后從合格的數(shù)據(jù)行中檢索BLOB或TEXT值。

　　把BLOB或TEXT列分離到單獨(dú)的表中。在某些環(huán)境中，如果把這些數(shù)據(jù)列移動(dòng)到第二張數(shù)據(jù)表中，可以讓你把原數(shù)據(jù)表中的數(shù)據(jù)列轉(zhuǎn)換為固定長(zhǎng)度的數(shù)據(jù)行格式，那么它就是有意義的。這會(huì)減少主表中的碎片，使你得到固定長(zhǎng)度數(shù)據(jù)行的性能優(yōu)勢(shì)。它還使你在主數(shù)據(jù)表上運(yùn)行SELECT *查詢(xún)的時(shí)候不會(huì)通過(guò)網(wǎng)絡(luò)傳輸大量的BLOB或TEXT值。

　　高效率地載入數(shù)據(jù)

　　在大多數(shù)情況下，你所關(guān)注的是SELECT查詢(xún)的優(yōu)化，因?yàn)镾ELECT查詢(xún)是最常見(jiàn)的查詢(xún)類(lèi)型，而且如何優(yōu)化它們又不是太簡(jiǎn)單。與此形成對(duì)比，把數(shù)據(jù)載入數(shù)據(jù)庫(kù)的操作就相對(duì)直接了。然而，你仍然可以利用某些策略來(lái)改善數(shù)據(jù)載入操作的效率。基本的原理如下所示：

　　? 批量載入比單行載入的效率高，因?yàn)樵诿織l記錄被載入后，鍵緩存（key cache）不用刷新（flush）；可以在這批記錄的末尾刷新鍵緩存。鍵緩存刷新的頻率減少得越多，數(shù)據(jù)載入的速度就越快。

　　? 沒(méi)有索引的數(shù)據(jù)表的載入速度比有索引的要快一些。如果存在索引，不但要把記錄添加到數(shù)據(jù)文件中，還必須修改索引來(lái)反映新增的記錄。

　　? 較短的SQL語(yǔ)句比較長(zhǎng)的SQL語(yǔ)句快，因?yàn)樗鼈兯婕暗椒?wù)器端分析過(guò)程較少，同時(shí)通過(guò)網(wǎng)絡(luò)把它們從客戶(hù)端發(fā)送到服務(wù)器上的速度也更快。

　　其中有些因素看起來(lái)是次要的（尤其是最后一個(gè)），但是如果你載入的數(shù)據(jù)很多，那么即使很小的效率差異也會(huì)導(dǎo)致一定的性能差別。我們可以從前面的一般原理得出幾條如何快速載入數(shù)據(jù)的實(shí)踐結(jié)論：

　　? LOAD DATA（所有形式的）比INSERT效率高，因?yàn)樗桥枯d入數(shù)據(jù)行的。服務(wù)器只需要分析和解釋一條語(yǔ)句，而不是多條語(yǔ)句。同樣，索引只需要在所有的數(shù)據(jù)行被處理過(guò)之后才刷新，而不是每行刷新一次。

　　? 不帶LOCAL的LOAD DATA比帶有LOCAL的LOAD DATA的速度要快。不帶LOCAL的時(shí)候，文件必須位于服務(wù)器上，而且你必須擁有FILE權(quán)限，但是服務(wù)器卻可以直接從磁盤(pán)上讀取文件。使用LOAD DATA LOCAL的時(shí)候，客戶(hù)端讀取文件并通過(guò)網(wǎng)絡(luò)把它發(fā)送給服務(wù)器，速度慢一些。

　　? 如果你必須使用INSERT，那么試著使用在一個(gè)語(yǔ)句中指定多個(gè)數(shù)據(jù)行的形式：

INSERT INTO tbl_name VALUES(...),(...),... ;

　　在這個(gè)語(yǔ)句中指定的數(shù)據(jù)行越多，效果就越好。這會(huì)減少必要的語(yǔ)句數(shù)量，并最小化索引刷新的次數(shù)。這一條結(jié)論看起來(lái)與前面所討論的"語(yǔ)句越短，執(zhí)行速度越快"相矛盾，但是實(shí)際上并不矛盾。這兒所討論的是同時(shí)插入多個(gè)數(shù)據(jù)行的一個(gè)INSERT語(yǔ)句所花費(fèi)的開(kāi)銷(xiāo)比功能相同的多個(gè)單行INSERT語(yǔ)句的花費(fèi)的開(kāi)銷(xiāo)要小一些，并且多行語(yǔ)句消耗的索引刷新開(kāi)銷(xiāo)也少一些。

　　如果你使用mysqldump生成數(shù)據(jù)庫(kù)備份文件，那么MySQL 4.1會(huì)默認(rèn)地生成多行INSERT語(yǔ)句：它會(huì)激活--opt (優(yōu)化)選項(xiàng)，而這個(gè)選項(xiàng)會(huì)激活--extended-insert選項(xiàng)，該選項(xiàng)生成多行INSERT語(yǔ)句，還存在其它一些選項(xiàng)也可以使數(shù)據(jù)被載入的時(shí)候，轉(zhuǎn)儲(chǔ)文件被處理的效率更高。對(duì)于MySQL 4.1以前的版本，你可以明確地指定--opt或--extended-insert選項(xiàng)。

　　使用mysqldump的時(shí)候要避免使用--complete-insert選項(xiàng)；它生成的INSERT語(yǔ)句是每個(gè)數(shù)據(jù)行一條語(yǔ)句的，語(yǔ)句總共會(huì)很長(zhǎng)，比多行語(yǔ)句需要的分析操作更多。

　　? 如果你必須使用INSERT語(yǔ)句，那么在可能的情況下，對(duì)它們進(jìn)行分組以減少索引的刷新。對(duì)于事務(wù)性的存儲(chǔ)引擎，在單個(gè)事務(wù)中提交，而不是在自動(dòng)提交（autocommit）模式下提交INSERT語(yǔ)句可以實(shí)現(xiàn)這樣的功能：

START TRANSACTION;
INSERT INTO tbl_name ... ;
INSERT INTO tbl_name ... ;
INSERT INTO tbl_name ... ;
COMMIT;

　　對(duì)于非事務(wù)性的存儲(chǔ)引擎，獲取數(shù)據(jù)表上的寫(xiě)入鎖，它被鎖定的時(shí)候提交INSERT語(yǔ)句：

LOCK TABLES tbl_name WRITE;
INSERT INTO tbl_name ... ;
INSERT INTO tbl_name ... ;
INSERT INTO tbl_name ... ;
UNLOCK TABLES;

　　無(wú)論采用哪種方法，你得到的好處都是相同的：索引在所有的語(yǔ)句都被執(zhí)行之后才刷新一次，而不是每個(gè)INSERT語(yǔ)句刷新一次索引。后面介紹了在自動(dòng)提交模式下或數(shù)據(jù)表沒(méi)有被鎖定的時(shí)候發(fā)生的情況。

　　? 對(duì)于MyISAM數(shù)據(jù)表，減少索引刷新的另外一個(gè)策略是使用DELAYED_KEY_WRITE表選項(xiàng)。使用這個(gè)選項(xiàng)的時(shí)候，數(shù)據(jù)行會(huì)像平常一樣立即寫(xiě)入數(shù)據(jù)文件中，但是鍵緩存只是偶爾刷新一次，而不是在每次插入操作之后都需要刷新。如果要在服務(wù)器上全面地使用延遲索引刷新，那么就需要使用--delay-key-write選項(xiàng)來(lái)啟動(dòng)mysqld。在這種情況下，每個(gè)數(shù)據(jù)表的索引塊寫(xiě)入操作都會(huì)被延遲，直到這些數(shù)據(jù)塊必須為其它的索引值提供空間、或者執(zhí)行了FLUSH TABLES命令、或者數(shù)據(jù)表被關(guān)閉的時(shí)候才執(zhí)行操作。

　　如果你選擇了對(duì)MyISAM數(shù)據(jù)表使用延遲鍵寫(xiě)入，那么不正常的服務(wù)器關(guān)閉可能會(huì)引起索引值的丟失。這不是致命的問(wèn)題，因?yàn)镸yISAM索引可以依據(jù)數(shù)據(jù)行來(lái)進(jìn)行修復(fù)，但是如果想讓修復(fù)過(guò)程出現(xiàn)，你就必須使用--myisam-recover=FORCE選項(xiàng)來(lái)啟動(dòng)服務(wù)器。這個(gè)選項(xiàng)會(huì)使服務(wù)器在打開(kāi)MyISAM數(shù)據(jù)表的時(shí)候檢查它們，如果有必要就自動(dòng)地修復(fù)它們。

　　對(duì)于復(fù)制（replication）從屬服務(wù)器，你可能希望使用--delay-key-write=ALL來(lái)延遲所有的MyISAM數(shù)據(jù)表索引的刷新，不管在主服務(wù)器上最初是如何建立它們的。

　　? 使用壓縮的客戶(hù)端/服務(wù)器協(xié)議來(lái)減少網(wǎng)絡(luò)上數(shù)據(jù)傳輸?shù)臄?shù)量。對(duì)于大多數(shù)MySQL客戶(hù)端來(lái)說(shuō)，我們都可以使用--compress命令行選項(xiàng)來(lái)指定它。通常，這個(gè)選項(xiàng)只是在較慢的網(wǎng)絡(luò)上使用，這是因?yàn)閴嚎s操作會(huì)花費(fèi)大量的處理器時(shí)間。

　　? 讓MySQL替你插入默認(rèn)值。也就是說(shuō)，無(wú)論如何都不要給INSERT語(yǔ)句中那些可以賦予默認(rèn)值的列指定值。平均起來(lái)，你的語(yǔ)句更短，減少了通過(guò)網(wǎng)絡(luò)發(fā)送到服務(wù)器的字符數(shù)量。此外，由于語(yǔ)句包含的值較少，服務(wù)器執(zhí)行的分析和值轉(zhuǎn)換操作也較少。

　　? 對(duì)于MyISAM數(shù)據(jù)表，如果你必須把大量的數(shù)據(jù)載入一個(gè)新表，最好建立不帶索引的表，載入數(shù)據(jù)，然后建立索引，這樣的工作次序的速度要快一些。一次性地建立索引比每行都更新索引的速度要快一些。對(duì)于已經(jīng)帶有索引的表，如果預(yù)先刪除或禁止索引，后來(lái)再重新建立或者激活索引，那么數(shù)據(jù)載入的速度也要快一些。這些策略不能應(yīng)用于InnoDB或BDB表，它們沒(méi)有對(duì)分離的索引建立過(guò)程進(jìn)行優(yōu)化。

　　如果你考慮使用刪除或禁止索引的策略，把數(shù)據(jù)載入MyISAM數(shù)據(jù)表，那么在評(píng)估獲得的優(yōu)勢(shì)的時(shí)候，就需要考慮整個(gè)環(huán)境。如果你把少量的數(shù)據(jù)載入大型的數(shù)據(jù)表中，那么在沒(méi)有任何特殊準(zhǔn)備工作的情況下，重新建立索引花費(fèi)的時(shí)間可能比載入數(shù)據(jù)的時(shí)間還要長(zhǎng)。

　　要?jiǎng)h除并且重新建立索引，需要使用DROP INDEX和CREATE INDEX，或者使用與索引相關(guān)的ALTER TABLE。禁止和激活索引有兩種辦法：

　　? 你可用使用ALTER TABLE的DISABLE KEYS和ENABLE KEYS形式：

ALTER TABLE tbl_name DISABLE KEYS;
ALTER TABLE tbl_name ENABLE KEYS;

　　這些語(yǔ)句關(guān)閉或打開(kāi)表中非唯一（non-unique）索引的更新過(guò)程。

　　ALTER TABLE的DISABLE KEYS和ENABLE KEYS子句是索引禁止和激活操作的推薦方法，因?yàn)榉?wù)器也是這樣操作的（如果你使用LOAD DATA語(yǔ)句把數(shù)據(jù)載入空的MyISAM表中，服務(wù)器會(huì)自動(dòng)地執(zhí)行這樣的優(yōu)化操作）。

　　? Myisamchk工具可以執(zhí)行索引維護(hù)。它直接在數(shù)據(jù)表文件上進(jìn)行操作，因此使用它的時(shí)候，你必須擁有數(shù)據(jù)表文件的寫(xiě)入權(quán)限。
使用myisamchk禁止MyISAM表的索引的方法是，首先你要確保已經(jīng)告訴了服務(wù)器讓該數(shù)據(jù)表獨(dú)立出來(lái)，接著把它移動(dòng)到適當(dāng)?shù)臄?shù)據(jù)庫(kù)目錄中，并運(yùn)行下面的命令：

% myisamchk --keys-used=0 tbl_name

　　載入數(shù)據(jù)之后，重新激活索引：

% myisamchk --recover --quick --keys-used=n tbl_name

　　其中的n是位掩碼（bitmask），它指明了要激活的索引。Bit 0（第一個(gè)位）與索引1對(duì)應(yīng)。例如，如果某張表?yè)碛腥齻€(gè)索引，那么n的值應(yīng)該是7（二進(jìn)制的111）。你也可以使用--description選項(xiàng)來(lái)檢測(cè)索引的數(shù)量：

% myisamchk --description tbl_name

　　前面的數(shù)據(jù)載入原則也可以應(yīng)用于混合查詢(xún)環(huán)境（客戶(hù)端執(zhí)行多種不同的操作）。例如，你應(yīng)該避免在那些頻繁被修改（寫(xiě)入）的數(shù)據(jù)表上運(yùn)行長(zhǎng)時(shí)間的SELECT查詢(xún)。這會(huì)引發(fā)大量的爭(zhēng)用（contention），導(dǎo)致寫(xiě)入操作的性能較差。一個(gè)可能的解決辦法是，如果你的寫(xiě)入操作主要是INSERT操作，那么把新記錄添加到輔助表中，接著周期性地把這些記錄添加到主表中。如果你必須立即訪問(wèn)這些新記錄，那么這個(gè)策略是不行的，但是如果你能夠承擔(dān)得起短期內(nèi)不訪問(wèn)這些數(shù)據(jù)的代價(jià)，那么使用輔助表可以在兩個(gè)方面帶來(lái)好處。首先，它減少了主表上的SELECT查詢(xún)爭(zhēng)用的問(wèn)題，因此它們執(zhí)行得更快。其次，把輔助表中的批量數(shù)據(jù)載入主表中所花費(fèi)的時(shí)間總和也比單獨(dú)載入記錄花費(fèi)的時(shí)間總和要小一些；鍵緩存只需要在每次批量載入結(jié)束后刷新一次，而不用每個(gè)數(shù)據(jù)行載入后都刷新一次。

　　使用這種策略的一個(gè)應(yīng)用是把Web服務(wù)器的Web頁(yè)面訪問(wèn)日志載入MySQL數(shù)據(jù)庫(kù)的時(shí)候。在這種情況下，保證實(shí)體立即進(jìn)入主表的優(yōu)先級(jí)并不高（沒(méi)有這個(gè)必要性）。

　　如果你在MyISAM表上使用了混合的INSERT和SELECT語(yǔ)句，你就可以利用并發(fā)性插入操作的優(yōu)點(diǎn)了。這個(gè)特性允許插入和檢索操作同時(shí)進(jìn)行，而不需要使用輔助表。你可以查看"使用并發(fā)性插入操作"部分。

上一篇：MySQL查詢(xún)優(yōu)化系列講座之查詢(xún)優(yōu)化器

下一篇：MySQL查詢(xún)優(yōu)化系列講座之調(diào)度和鎖定