SQL優化之針對count、表的連接順序、條件順序、in及exist的優化

2020-07-26 14:19:05

字體：大中小

來源：轉載

供稿：網友

本文詳述了SQL優化中針對count、表的連接順序、條件順序、in及exist的優化，非常具有實用價值！詳述如下：

一、關于count

看過一些網上關于count(*)和count(列)的文章，count(列)的效率一定比count(*)高嗎？

其實個人覺得count(*)和count(列)根本就沒有可比性，count(*)統計的是表里面的總條數，而count(列)統計的是當列的非空記錄條數。

不過我們可以通過實驗來比較一下：

首先創建測試表：

drop table test purge;create table test as select * from dba_objects;update test set object_id =rownum ;set timing on set linesize 1000set autotrace on

執行

select count(*) from test;select count(object_id) from test;

發現耗時是一樣的，難道他們的效率其實是一樣的嗎？

我們在列object_id上創建索引試試看

create index idx_object_id on test(object_id);

然后再執行

select count(*) from test;select count(object_id) from test;

發現count(object_id)的速度明顯比count(*)高出一大截，難道是因為count(object_id)能用到索引，所以效率才提高了很多？

我們再修改下object_id的列屬性

alter table test modify object_id not null;

然后再執行

select count(*) from test;select count(object_id) from test;

發現其實他們的速度是一樣快的，count(*)也可用到索引。
其實效率比較的前提是兩個語句的寫法要等價，這兩種寫法根本就不等價，因此不具有可比性。

對于oracle優化器來說，我們可以通過實驗發現，count不同的列，統計的時間是不一樣的，大致趨勢是列越靠后，訪問的開銷越大，列的偏移量決定訪問的性能。而count(*)的開銷與偏移量無關。因此，在某些場合count(*)反而是最快的。

二、關于in和exist

關于in和exist的說法大都是說in的效率比exist高，所以有in的地方必需得換成exist等等。但是真的是這樣的嗎？

下面我們來做個試驗：

在Oracle 10g中;

select * from dept where deptno NOT IN ( select deptno from emp ) ;select * from dept where not exists ( select deptno from emp where emp.deptno=dept.deptno) ;

我們發現，exist確實比in的效率高啊。這個說法貌似是成立的啊。

但是我們再執行下面的語句

select * from dept where deptno NOT IN ( select deptno from emp where deptno is not null) and deptno is not null;

你會發現加上非空的約束條件后，in和exist的效率是一樣的。

查看三個語句的執行計劃你就會發現，沒有加上非空約束的in語句和exist語句走的都是ANTI半連接算法，所以效率是一樣的，而未加非空約束的in語句用的是filter，而不是ANTI算法，所以效率就差一些。

所以我們可以得出結論：在oracle 10g中，如果可以確保非空，則in約束可以用到ANTI的半連接算法，這時候的效率和exist是一樣的。

在Oracle 11g中：

select * from dept where deptno NOT IN ( select deptno from emp ) ;select * from dept where not exists ( select deptno from emp where emp.deptno=dept.deptno) ;

我們發現兩個語句的效率是一樣的，查看執行計劃也是一樣的。原來oracle在11g中已經做了優化，所以in和exist的效率是一樣的。

由此我們可以得出結論，在11g中，使用in和exist的效率是一樣的，因為他們走的都是比較高效的ANTI算法。

三、關于大小表的連接順序

在網上我們可以看到很多這樣的文章，在進行多表查詢的時候，用小表或者交叉表做基礎表，放在后面，大表放在from后面的位置，因為表的訪問順序是從右往左的。

但是真的是這樣的嗎？

我們可以做實驗驗證一下（此處測試環境為 Oracle 11g）：

create table tab_big as select * from dba_objects where rownum<=30000;create table tab_small as select * from dba_objects where rownum<=10;set autotrace traceonlyset linesize 1000set timing on select count(*) from tab_big,tab_small ; select count(*) from tab_small,tab_big ;

我們查看執行計劃可以發現，這兩個語句的效率是一樣的，難道多表查詢，表的順序和效率無關嗎？

我們在執行下面的語句：

select /*+rule*/ count(*) from tab_big,tab_small ; select /*+rule*/ count(*) from tab_small,tab_big ;

我們可以清楚的發現，小表在右，大表在左的語句，查詢效率高很多。

其實，在基于規則時代，查詢效率是和表的連接順序相關的，小表或者交叉表在左，大表在右的執行效率會高一些。但是現在基本上是基于代價的時代，所以大小表的順序和效率無關，oracle優化器會自動去進行效率優化。

四、where子句中的連接條件順序

在基于規則時代，oracle采用自下而上的順序來解析where子句，根據這個原理，我們一般會將可能返回行數最少的表放在最后面，where子句中有過濾條件的子句放在最后面。

但是在現在基于代價時代，這種優化都有oracle優化器幫忙優化了，所以關于表的順序和條件的順序已經不會影響我們的查詢效率了。

上一篇：oracle截取字符(substr)檢索字符位置(instr)示例介紹

下一篇：oracle清空所有表數據

學習交流

選擇筆記本處理器（CPU）需避免那些誤區和基

選擇筆記本處理器（CPU）需避免那些誤區和基本常識...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

中國移動6月凈增5G套餐用戶1459萬戶累計達7019.9萬戶

2020-07-20 18:48:56

螞蟻集團計劃在科創板和港交所同步上市估值超2000億美元

2020-07-20 18:46:41

傳滴滴最快年內在香港IPO 目標估值800億美元

2020-07-20 18:43:20

小鵬汽車宣布C+輪融資近5億美元高瓴紅杉等為主要投資者

2020-07-20 18:35:48

微博內測熱搜定制功能你可以愉快地吃瓜了嗎？

2020-07-17 23:29:31

Twitter證實：黑客一共瞄準130個名人賬號

2020-07-17 23:24:56

疑難解答

圖片精選

網友關注

国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

SQL優化之針對count、表的連接順序、條件順序、in及exist的優化