mysql數據庫優化的知識點有什么

2024-07-24 12:34:11

字體：大中小

來源：轉載

供稿：網友

　　小編給大家分享一下mysql數據庫優化的知識點有哪些，希望大家閱讀完這篇文章之后都有所收獲，下面讓我們一起去探討吧！

　　mysql數據庫優化

　　減少數據訪問：設置合理的字段類型，啟用壓縮，通過索引訪問等減少磁盤IO
　　返回更少的數據：只返回需要的字段和數據分頁處理減少磁盤io及網絡io
　　減少交互次數：批量DML操作，函數存儲等減少數據連接次數
　　減少服務器CPU開銷：盡量減少數據庫排序操作以及全表查詢，減少cpu 內存占用
　　利用更多資源：使用表分區，可以增加并行操作，更大限度利用cpu資源
　　總結到SQL優化中，就三點:

　　最大化利用索引；
　　盡可能避免全表掃描；
　　減少無效數據的查詢；
　　理解SQL優化原理，首先要搞清楚SQL執行順序：

　　SELECT語句 - 語法順序：
　　1. SELECT
　　2. DISTINCT <select_list>
　　3. FROM <left_table>
　　4. <join_type> JOIN <right_table>
　　5. ON <join_condition>
　　6. WHERE <where_condition>
　　7. GROUP BY <group_by_list>
　　8. HAVING <having_condition>
　　9. ORDER BY <order_by_condition>
　　10.LIMIT <limit_number>
　　SELECT語句 - 執行順序：
　　FROM
　　<表名> # 選取表，將多個表數據通過笛卡爾積變成一個表。
　　ON
　　<篩選條件> # 對笛卡爾積的虛表進行篩選
　　JOIN <join, left join, right join...>
　　<join表> # 指定join，用于添加數據到on之后的虛表中，例如left join會將左表的剩余數據添加到虛表中
　　WHERE
　　<where條件> # 對上述虛表進行篩選
　　GROUP BY
　　<分組條件> # 分組
　　<SUM()等聚合函數> # 用于having子句進行判斷，在書寫上這類聚合函數是寫在having判斷里面的
　　HAVING
　　<分組篩選> # 對分組后的結果進行聚合篩選
　　SELECT
　　<返回數據列表> # 返回的單列必須在group by子句中，聚合函數除外
　　DISTINCT
　　# 數據除重
　　ORDER BY
　　<排序條件> # 排序
　　LIMIT
　　<行數限制>

　　SQL優化策略
　　聲明：以下SQL優化策略適用于數據量較大的場景下，如果數據量較小，沒必要以此為準，以免畫蛇添足。

　　一、避免不走索引的場景
　　1. 盡量避免在字段開頭模糊查詢，會導致數據庫引擎放棄索引進行全表掃描。如下：

　　SELECT * FROM t WHERE username LIKE '%陳%'
　　優化方式：盡量在字段后面使用模糊查詢。如下：

　　SELECT * FROM t WHERE username LIKE '陳%'
　　如果需求是要在前面使用模糊查詢，

　　使用MySQL內置函數INSTR(str,substr) 來匹配，作用類似于java中的indexOf()，查詢字符串出現的角標位置，可參閱《MySQL模糊查詢用法大全（正則、通配符、內置函數等）》
　　使用FullText全文索引，用match against 檢索
　　數據量較大的情況，建議引用ElasticSearch、solr，億級數據量檢索速度秒級
　　當表數據量較少（幾千條兒那種），別整花里胡哨的，直接用like '%xx%'。
　　2. 盡量避免使用in 和not in，會導致引擎走全表掃描。如下：

　　SELECT * FROM t WHERE id IN (2,3)
　　優化方式：如果是連續數值，可以用between代替。如下：

　　SELECT * FROM t WHERE id BETWEEN 2 AND 3
　　如果是子查詢，可以用exists代替。詳情見《MySql中如何用exists代替in》如下：

　　-- 不走索引
　　select * from A where A.id in (select id from B);
　　-- 走索引
　　select * from A where exists (select * from B where B.id = A.id);
　　3. 盡量避免使用 or，會導致數據庫引擎放棄索引進行全表掃描。如下：

　　SELECT * FROM t WHERE id = 1 OR id = 3
　　優化方式：可以用union代替or。如下：

　　SELECT * FROM t WHERE id = 1
　　   UNION
　　SELECT * FROM t WHERE id = 3
　　4. 盡量避免進行null值的判斷，會導致數據庫引擎放棄索引進行全表掃描。如下：

　　SELECT * FROM t WHERE score IS NULL
　　優化方式：可以給字段添加默認值0，對0值進行判斷。如下：

　　SELECT * FROM t WHERE score = 0
　　5.盡量避免在where條件中等號的左側進行表達式、函數操作，會導致數據庫引擎放棄索引進行全表掃描。

　　可以將表達式、函數操作移動到等號右側。如下：

　　-- 全表掃描
　　SELECT * FROM T WHERE score/10 = 9
　　-- 走索引
　　SELECT * FROM T WHERE score = 10*9
　　6. 當數據量大時，避免使用where 1=1的條件。通常為了方便拼裝查詢條件，我們會默認使用該條件，數據庫引擎會放棄索引進行全表掃描。如下：

　　SELECT username, age, sex FROM T WHERE 1=1
　　優化方式：用代碼拼裝sql時進行判斷，沒 where 條件就去掉 where，有where條件就加 and。

　　7. 查詢條件不能用 <> 或者 !=

　　使用索引列作為條件進行查詢時，需要避免使用<>或者!=等判斷條件。如確實業務需要，使用到不等于符號，需要在重新評估索引建立，避免在此字段上建立索引，改由查詢條件中其他索引字段代替。

　　8. where條件僅包含復合索引非前置列

　　如下：復合（聯合）索引包含key_part1，key_part2，key_part3三列，但SQL語句沒有包含索引前置列"key_part1"，按照MySQL聯合索引的最左匹配原則，不會走聯合索引。詳情參考《聯合索引的使用原理》。

　　select col1 from table where key_part2=1 and key_part3=2
　　9. 隱式類型轉換造成不使用索引

　　如下SQL語句由于索引對列類型為varchar，但給定的值為數值，涉及隱式類型轉換，造成不能正確走索引。

　　select col1 from table where col_varchar=123;
　　10. order by 條件要與where中條件一致，否則order by不會利用索引進行排序

　　-- 不走age索引
　　SELECT * FROM t order by age;

　　-- 走age索引
　　SELECT * FROM t where age > 0 order by age;
　　對于上面的語句，數據庫的處理順序是：

　　第一步：根據where條件和統計信息生成執行計劃，得到數據。
　　第二步：將得到的數據排序。當執行處理數據（order by）時，數據庫會先查看第一步的執行計劃，看order by 的字段是否在執行計劃中利用了索引。如果是，則可以利用索引順序而直接取得已經排好序的數據。如果不是，則重新進行排序操作。
　　第三步：返回排序后的數據。
　　當order by 中的字段出現在where條件中時，才會利用索引而不再二次排序，更準確的說，order by 中的字段在執行計劃中利用了索引時，不用排序操作。

　　這個結論不僅對order by有效，對其他需要排序的操作也有效。比如group by 、union 、distinct等。

　　11. 正確使用hint優化語句

　　MySQL中可以使用hint指定優化器在執行時選擇或忽略特定的索引。一般而言，處于版本變更帶來的表結構索引變化，更建議避免使用hint，而是通過Analyze table多收集統計信息。但在特定場合下，指定hint可以排除其他索引干擾而指定更優的執行計劃。

　　USE INDEX 在你查詢語句中表名的后面，添加 USE INDEX 來提供希望 MySQL 去參考的索引列表，就可以讓 MySQL 不再考慮其他可用的索引。例子: SELECT col1 FROM table USE INDEX (mod_time, name)...
　　IGNORE INDEX 如果只是單純的想讓 MySQL 忽略一個或者多個索引，可以使用 IGNORE INDEX 作為 Hint。例子: SELECT col1 FROM table IGNORE INDEX (priority) ...
　　FORCE INDEX 為強制 MySQL 使用一個特定的索引，可在查詢中使用FORCE INDEX 作為Hint。例子: SELECT col1 FROM table FORCE INDEX (mod_time) ...
　　在查詢的時候，數據庫系統會自動分析查詢語句，并選擇一個最合適的索引。但是很多時候，數據庫系統的查詢優化器并不一定總是能使用最優索引。如果我們知道如何選擇索引，可以使用FORCE INDEX強制查詢使用指定的索引?！禡ySQL中特別實用的幾種SQL語句送給大家》博文建議閱讀，干貨

　　例如：

　　SELECT * FROM students FORCE INDEX (idx_class_id) WHERE class_id = 1 ORDER BY id DESC;
　　二、SELECT語句其他優化
　　1. 避免出現select *

　　首先，select * 操作在任何類型數據庫中都不是一個好的SQL編寫習慣。

　　使用select * 取出全部列，會讓優化器無法完成索引覆蓋掃描這類優化，會影響優化器對執行計劃的選擇，也會增加網絡帶寬消耗，更會帶來額外的I/O,內存和CPU消耗。

　　建議提出業務實際需要的列數，將指定列名以取代select *。具體詳情見《為什么大家都說SELECT * 效率低》：

　　2. 避免出現不確定結果的函數

　　特定針對主從復制這類業務場景。由于原理上從庫復制的是主庫執行的語句，使用如now()、rand()、sysdate()、current_user()等不確定結果的函數很容易導致主庫與從庫相應的數據不一致。另外不確定值的函數,產生的SQL語句無法利用query cache。

　　3.多表關聯查詢時，小表在前，大表在后。

　　在MySQL中，執行 from 后的表關聯查詢是從左往右執行的（Oracle相反），第一張表會涉及到全表掃描，所以將小表放在前面，先掃小表，掃描快效率較高，在掃描后面的大表，或許只掃描大表的前100行就符合返回條件并return了。

　　例如：表1有50條數據，表2有30億條數據；如果全表掃描表2，你品，那就先去吃個飯再說吧是吧。

　　4. 使用表的別名

　　當在SQL語句中連接多個表時，請使用表的別名并把別名前綴于每個列名上。這樣就可以減少解析的時間并減少哪些友列名歧義引起的語法錯誤。

　　5. 用where字句替換HAVING字句

　　避免使用HAVING字句，因為HAVING只會在檢索出所有記錄之后才對結果集進行過濾，而where則是在聚合前刷選記錄，如果能通過where字句限制記錄的數目，那就能減少這方面的開銷。HAVING中的條件一般用于聚合函數的過濾，除此之外，應該將條件寫在where字句中。

　　where和having的區別：where后面不能使用組函數

　　6.調整Where字句中的連接順序

　　MySQL采用從左往右，自上而下的順序解析where子句。根據這個原理，應將過濾數據多的條件往前放，最快速度縮小結果集。

　　三、增刪改 DML 語句優化
　　1. 大批量插入數據

　　如果同時執行大量的插入，建議使用多個值的INSERT語句(方法二)。這比使用分開INSERT語句快（方法一），一般情況下批量插入效率有幾倍的差別。

　　方法一：

　　insert into T values(1,2);

　　insert into T values(1,3);

　　insert into T values(1,4);
　　方法二：

　　Insert into T values(1,2),(1,3),(1,4);
　　選擇后一種方法的原因有三。

　　減少SQL語句解析的操作，MySQL沒有類似Oracle的share pool，采用方法二，只需要解析一次就能進行數據的插入操作；
　　在特定場景可以減少對DB連接次數
　　SQL語句較短，可以減少網絡傳輸的IO。
　　2. 適當使用commit

　　適當使用commit可以釋放事務占用的資源而減少消耗，commit后能釋放的資源如下：

　　事務占用的undo數據塊；
　　事務在redo log中記錄的數據塊；
　　釋放事務施加的，減少鎖爭用影響性能。特別是在需要使用delete刪除大量數據的時候，必須分解刪除量并定期commit。
　　3. 避免重復查詢更新的數據

　　針對業務中經常出現的更新行同時又希望獲得改行信息的需求，MySQL并不支持PostgreSQL那樣的UPDATE RETURNING語法，在MySQL中可以通過變量實現。

　　例如，更新一行記錄的時間戳，同時希望查詢當前記錄中存放的時間戳是什么，簡單方法實現：

　　Update t1 set time=now() where col1=1;

　　Select time from t1 where id =1;
　　使用變量，可以重寫為以下方式：

　　Update t1 set time=now () where col1=1 and @now: = now ();

　　Select @now;
　　前后二者都需要兩次網絡來回，但使用變量避免了再次訪問數據表，特別是當t1表數據量較大時，后者比前者快很多。

　　4.查詢優先還是更新（insert、update、delete）優先

　　MySQL 還允許改變語句調度的優先級，它可以使來自多個客戶端的查詢更好地協作，這樣單個客戶端就不會由于鎖定而等待很長時間。改變優先級還可以確保特定類型的查詢被處理得更快。我們首先應該確定應用的類型，判斷應用是以查詢為主還是以更新為主的，是確保查詢效率還是確保更新的效率，決定是查詢優先還是更新優先。下面我們提到的改變調度策略的方法主要是針對只存在表鎖的存儲引擎，比如 MyISAM 、MEMROY、MERGE，對于Innodb 存儲引擎，語句的執行是由獲得行鎖的順序決定的。MySQL 的默認的調度策略可用總結如下：

　　1）寫入操作優先于讀取操作。

　　2）對某張數據表的寫入操作某一時刻只能發生一次，寫入請求按照它們到達的次序來處理。

　　3）對某張數據表的多個讀取操作可以同時地進行。MySQL 提供了幾個語句調節符，允許你修改它的調度策略：

　　LOW_PRIORITY關鍵字應用于DELETE、INSERT、LOAD DATA、REPLACE和UPDATE；
　　HIGH_PRIORITY關鍵字應用于SELECT和INSERT語句；
　　DELAYED關鍵字應用于INSERT和REPLACE語句。
　　如果寫入操作是一個 LOW_PRIORITY（低優先級）請求，那么系統就不會認為它的優先級高于讀取操作。在這種情況下，如果寫入者在等待的時候，第二個讀取者到達了，那么就允許第二個讀取者插到寫入者之前。只有在沒有其它的讀取者的時候，才允許寫入者開始操作。這種調度修改可能存在 LOW_PRIORITY寫入操作永遠被阻塞的情況。

　　SELECT 查詢的HIGH_PRIORITY（高優先級）關鍵字也類似。它允許SELECT 插入正在等待的寫入操作之前，即使在正常情況下寫入操作的優先級更高。另外一種影響是，高優先級的 SELECT 在正常的 SELECT 語句之前執行，因為這些語句會被寫入操作阻塞。如果希望所有支持LOW_PRIORITY 選項的語句都默認地按照低優先級來處理，那么請使用--low-priority-updates 選項來啟動服務器。通過使用 INSERTHIGH_PRIORITY 來把 INSERT 語句提高到正常的寫入優先級，可以消除該選項對單個INSERT語句的影響。

　　四、查詢條件優化
　　1. 對于復雜的查詢，可以使用中間臨時表暫存數據；

　　2. 優化group by語句

　　默認情況下，MySQL 會對GROUP BY分組的所有值進行排序，如 “GROUP BY col1，col2，....;” 查詢的方法如同在查詢中指定 “ORDER BY col1，col2，...;” 如果顯式包括一個包含相同的列的 ORDER BY子句，MySQL 可以毫不減速地對它進行優化，盡管仍然進行排序。

　　因此，如果查詢包括 GROUP BY 但你并不想對分組的值進行排序，你可以指定 ORDER BY NULL禁止排序。例如：

　　SELECT col1, col2, COUNT(*) FROM table GROUP BY col1, col2 ORDER BY NULL ;
　　3. 優化join語句

　　MySQL中可以通過子查詢來使用 SELECT 語句來創建一個單列的查詢結果，然后把這個結果作為過濾條件用在另一個查詢中。使用子查詢可以一次性的完成很多邏輯上需要多個步驟才能完成的 SQL 操作，同時也可以避免事務或者表鎖死，并且寫起來也很容易。但是，有些情況下，子查詢可以被更有效率的連接(JOIN)..替代。

　　例子：假設要將所有沒有訂單記錄的用戶取出來，可以用下面這個查詢完成：

　　SELECT col1 FROM customerinfo WHERE CustomerID NOT in (SELECT CustomerID FROM salesinfo )
　　如果使用連接(JOIN).. 來完成這個查詢工作，速度將會有所提升。尤其是當 salesinfo表中對 CustomerID 建有索引的話，性能將會更好，查詢如下：

　　SELECT col1 FROM customerinfo
　　   LEFT JOIN salesinfoON customerinfo.CustomerID=salesinfo.CustomerID
　　      WHERE salesinfo.CustomerID IS NULL
　　連接(JOIN).. 之所以更有效率一些，是因為 MySQL 不需要在內存中創建臨時表來完成這個邏輯上的需要兩個步驟的查詢工作。

　　4. 優化union查詢

　　MySQL通過創建并填充臨時表的方式來執行union查詢。除非確實要消除重復的行，否則建議使用union all。原因在于如果沒有all這個關鍵詞，MySQL會給臨時表加上distinct選項，這會導致對整個臨時表的數據做唯一性校驗，這樣做的消耗相當高。

　　高效：

　　SELECT COL1, COL2, COL3 FROM TABLE WHERE COL1 = 10

　　UNION ALL

　　SELECT COL1, COL2, COL3 FROM TABLE WHERE COL3= 'TEST';
　　低效：

　　SELECT COL1, COL2, COL3 FROM TABLE WHERE COL1 = 10

　　UNION

　　SELECT COL1, COL2, COL3 FROM TABLE WHERE COL3= 'TEST';
　　5.拆分復雜SQL為多個小SQL，避免大事務

　　簡單的SQL容易使用到MySQL的QUERY CACHE；
　　減少鎖表時間特別是使用MyISAM存儲引擎的表；
　　可以使用多核CPU。
　　6. 使用truncate代替delete

　　當刪除全表中記錄時，使用delete語句的操作會被記錄到undo塊中，刪除記錄也記錄binlog，當確認需要刪除全表時，會產生很大量的binlog并占用大量的undo數據塊，此時既沒有很好的效率也占用了大量的資源。

　　使用truncate替代，不會記錄可恢復的信息，數據不能被恢復。也因此使用truncate操作有其極少的資源占用與極快的時間。另外，使用truncate可以回收表的水位，使自增字段值歸零。

　　7. 使用合理的分頁方式以提高分頁效率

　　使用合理的分頁方式以提高分頁效率針對展現等分頁需求，合適的分頁方式能夠提高分頁的效率。

　　案例1：

　　select * from t where thread_id = 10000 and deleted = 0
　　   order by gmt_create asc limit 0, 15;
　　上述例子通過一次性根據過濾條件取出所有字段進行排序返回。數據訪問開銷=索引IO+索引全部記錄結果對應的表數據IO。因此，該種寫法越翻到后面執行效率越差，時間越長，尤其表數據量很大的時候。

　　適用場景：當中間結果集很?。?0000行以下）或者查詢條件復雜（指涉及多個不同查詢字段或者多表連接）時適用。

　　案例2：

　　select t.* from (select id from t where thread_id = 10000 and deleted = 0
　　   order by gmt_create asc limit 0, 15) a, t
　　      where a.id = t.id;
　　上述例子必須滿足t表主鍵是id列，且有覆蓋索引secondary key:(thread_id, deleted, gmt_create)。通過先根據過濾條件利用覆蓋索引取出主鍵id進行排序，再進行join操作取出其他字段。數據訪問開銷=索引IO+索引分頁后結果（例子中是15行）對應的表數據IO。因此，該寫法每次翻頁消耗的資源和時間都基本相同，就像翻第一頁一樣。

　　適用場景：當查詢和排序字段（即where子句和order by子句涉及的字段）有對應覆蓋索引時，且中間結果集很大的情況時適用。

　　五、建表優化
　　1. 在表中建立索引，優先考慮where、order by使用到的字段。

　　2. 盡量使用數字型字段（如性別，男：1 女：2），若只含數值信息的字段盡量不要設計為字符型，這會降低查詢和連接的性能，并會增加存儲開銷。
　　這是因為引擎在處理查詢和連接時會逐個比較字符串中每一個字符，而對于數字型而言只需要比較一次就夠了。

　　3. 查詢數據量大的表會造成查詢緩慢。主要的原因是掃描行數過多。這個時候可以通過程序，分段分頁進行查詢，循環遍歷，將結果合并處理進行展示。要查詢100000到100050的數據，如下：

　　SELECT * FROM (SELECT ROW_NUMBER() OVER(ORDER BY ID ASC) AS rowid,*
　　   FROM infoTab)t WHERE t.rowid > 100000 AND t.rowid <= 100050
　　4. 用varchar/nvarchar 代替 char/nchar

　　盡可能的使用 varchar/nvarchar 代替 char/nchar ，因為首先變長字段存儲空間小，可以節省存儲空間，其次對于查詢來說，在一個相對較小的字段內搜索效率顯然要高些。
　　不要以為 NULL 不需要空間，比如：char(100) 型，在字段建立時，空間就固定了，不管是否插入值（NULL也包含在內），都是占用 100個字符的空間的，如果是varchar這樣的變長字段， null 不占用空間。

（編輯：武林網）

上一篇：MySQL基礎常用命令有哪幾點

下一篇：mysql中in和or的差異有哪些