21. 用EXISTS替換DISTINCT
當(dāng)提交一個(gè)包含一對(duì)多表資訊(比如部門表和雇員表)的查詢時(shí),避免在SELECT子句中使用DISTINCT.
一般可以考慮用EXIST替換
 
例如:
低效:
SELECT DISTINCT DEPT_NO,DEPT_NAME
FROM DEPT D,EMP E
WHERE D.DEPT_NO = E.DEPT_NO
高效:
SELECT DEPT_NO,DEPT_NAME
FROM DEPT D
WHERE EXISTS ( SELECT ‘X’
FROM EMP E
WHERE E.DEPT_NO = D.DEPT_NO);
 
EXISTS 使查詢更爲(wèi)迅速,因爲(wèi)RDBMS核心模組將在子查詢的條件一旦滿足後,馬上返回結(jié)果.
 
22. 識(shí)別’低效執(zhí)行’的SQL語(yǔ)句
 
用下列SQL工具找出低效SQL:
 
SELECT EXECUTIONS , DISK_READS, BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM V$SQLAREA
WHERE EXECUTIONS>0
AND BUFFER_GETS > 0
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8
ORDER BY 4 DESC;
 
(譯者按: 雖然目前各種關(guān)於SQL優(yōu)化的圖形化工具層出不窮,但是寫出自己的SQL工具來解決問題始終是一個(gè)最好的方法)
 
23. 使用TKPROF 工具來查詢SQL性能狀態(tài)
 
SQL trace 工具收集正在執(zhí)行的SQL的性能狀態(tài)資料並記錄到一個(gè)跟蹤文件中.
這個(gè)跟蹤文件提供了許多有用的資訊,例如解析次數(shù).執(zhí)行次數(shù),CPU使用時(shí)間等.這些資料將可以用來優(yōu)化你的系統(tǒng).
 
設(shè)置SQL TRACE在會(huì)話級(jí)別: 有效
 
ALTER session SET SQL_TRACE TRUE
 
設(shè)置SQL TRACE 在整個(gè)資料庫(kù)有效仿, 你必須將SQL_TRACE參數(shù)在init.ora中設(shè)爲(wèi)TRUE,
USER_DUMP_DEST參數(shù)說明了生成跟蹤文件的目錄
 
(譯者按: 這一節(jié)中,作者並沒有提到TKPROF的用法, 對(duì)SQL TRACE的用法也不夠準(zhǔn)確, 設(shè)置SQL
TRACE首先要在init.ora中設(shè)定TIMED_STATISTICS, 這樣才能得到那些重要的時(shí)間狀態(tài).
生成的trace文件是不可讀的,所以要用TKPROF工具對(duì)其進(jìn)行轉(zhuǎn)換,TKPROF有許多執(zhí)行參數(shù).
大家可以參考Oracle手冊(cè)來瞭解具體的配置. )
 
24. 用EXPLAIN PLAN 分析SQL語(yǔ)句
EXPLAIN PLAN 是一個(gè)很好的分析SQL語(yǔ)句的工具,它甚至可以在不執(zhí)行SQL的情況下分析語(yǔ)句.
通過分析,我們就可以知道ORACLE是怎麼樣連接表,使用什麼方式掃描表(索引掃描或全表掃描)以及使用到的索引名稱.
你需要按照從裏到外,從上到下的次序解讀分析的結(jié)果. EXPLAIN PLAN分析的結(jié)果是用縮進(jìn)的格式排列的,
最內(nèi)部的操作將被最先解讀, 假如兩個(gè)操作處?kù)锻粚又?帶有最小操作號(hào)的將被首先執(zhí)行.
NESTED LOOP是少數(shù)不按照上述規(guī)則處理的操作, 正確的執(zhí)行路徑是檢查對(duì)NESTED
LOOP提供資料的操作,其中操作號(hào)最小的將被最先處理.
 
譯者按:
 
通過實(shí)踐, 感到還是用SQLPLUS中的SET TRACE 功能比較方便.
舉例:
 
SQL> list
1 SELECT *
2 FROM dept, emp
3* WHERE emp.deptno = dept.deptno
SQL> set autotrace traceonly /*traceonly 可以不顯示執(zhí)行結(jié)果*/
SQL> /
14 rows selected.
                         
Execution Plan
----------------------------------------------------------
0 SELECT STATEMENT Optimizer=CHOOSE
1 0 NESTED LOOPS
2 1 TABLE access (FULL) OF 'EMP'
3 1 TABLE ACCESS (BY INDEX ROWID) OF 'DEPT'
4 3 INDEX (UNIQUE SCAN) OF 'PK_DEPT' (UNIQUE)
 
Statistics
----------------------------------------------------------
0 recursive calls
2 db block gets
30 consistent gets
0 physical reads
0 redo size
2598 bytes sent via SQL*Net to client
503 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
14 rows processed
 
通過以上分析,可以得出實(shí)際的執(zhí)行步驟是:
1. TABLE ACCESS (FULL) OF 'EMP'
2. INDEX (UNIQUE SCAN) OF 'PK_DEPT' (UNIQUE)
3. TABLE ACCESS (BY INDEX ROWID) OF 'DEPT'
4. NESTED LOOPS (JOINING 1 AND 3)
注: 目前許多第三方的工具如TOAD和ORACLE本身提供的工具如OMS的SQL Analyze都提供了極其方便的EXPLAIN
PLAN工具.也許喜歡圖形化介面的朋友們可以選用它們.
25. 用索引提高效率
索引是表的一個(gè)概念部分,用來提高檢索資料的效率. 實(shí)際上,ORACLE使用了一個(gè)複雜的自平衡B-tree結(jié)構(gòu).
通常,通過索引查詢資料比全表掃描要快. 當(dāng)ORACLE找出執(zhí)行查詢和Update語(yǔ)句的最佳路徑時(shí), ORACLE優(yōu)化器將使用索引.
同樣在聯(lián)結(jié)多個(gè)表時(shí)使用索引也可以提高效率. 另一個(gè)使用索引的好處是,它提供了主鍵(primary key)的唯一性驗(yàn)證.
除了那些LONG或LONG RAW資料類型, 你可以索引幾乎所有的列. 通常, 在大型表中使用索引特別有效. 當(dāng)然,你也會(huì)發(fā)現(xiàn),
在掃描小表時(shí),使用索引同樣能提高效率.
雖然使用索引能得到查詢效率的提高,但是我們也必須注重到它的代價(jià). 索引需要空間來
存儲(chǔ),也需要定期維護(hù), 每當(dāng)有記錄在表中增減或索引列被修改時(shí), 索引本身也會(huì)被修改. 這意味著每條記錄的INSERT ,
DELETE , UPDATE將爲(wèi)此多付出4 , 5 次的磁片I/O .
因爲(wèi)索引需要額外的存儲(chǔ)空間和處理,那些不必要的索引反而會(huì)使查詢反應(yīng)時(shí)間變慢.
 
譯者按:
定期的重構(gòu)索引是有必要的.
ALTER INDEX REBUILD 
 
26. 索引的操作
 
ORACLE對(duì)索引有兩種訪問模式.
 
索引唯一掃描 ( INDEX UNIQUE SCAN)
 
大多數(shù)情況下, 優(yōu)化器通過WHERE子句訪問INDEX.
 
例如:
表LODGING有兩個(gè)索引 :
建立在LODGING列上的唯一性索引LODGING_PK和建立在MANAGER列上的非唯一性索引LODGING$MANAGER.
 
SELECT *
FROM LODGING
WHERE LODGING = ‘ROSE HILL’;
 
在內(nèi)部 , 上述SQL將被分成兩步執(zhí)行, 首先 , LODGING_PK 索引將通過索引唯一掃描的方式被訪問 ,
獲得相對(duì)應(yīng)的ROWID, 通過ROWID訪問表的方式 執(zhí)行下一步檢索.
假如被檢索返回的列包括在INDEX列中,ORACLE將不執(zhí)行第二步的處理(通過ROWID訪問表). 因爲(wèi)檢索資料保存在索引中,
單單訪問索引就可以完全滿足查詢結(jié)果.
下面SQL只需要INDEX UNIQUE SCAN 操作.
 
SELECT LODGING
FROM LODGING
WHERE LODGING = ‘ROSE HILL’;
 
索引範(fàn)圍查詢(INDEX RANGE SCAN)
                         
適用於兩種情況:
1. 基於一個(gè)範(fàn)圍的檢索
2. 基於非唯一性索引的檢索
 
例1:
 
SELECT LODGING
FROM LODGING
WHERE LODGING LIKE ‘M%’;
 
WHERE子句條件包括一系列值, ORACLE將通過索引範(fàn)圍查詢的方式查詢LODGING_PK . 由於索引範(fàn)圍查詢將返回一組值,
它的效率就要比索引唯一掃描
低一些.
 
例2:
 
SELECT LODGING
FROM LODGING
WHERE MANAGER = ‘BILL GATES’;
 
這個(gè)SQL的執(zhí)行分兩步, LODGING$MANAGER的索引範(fàn)圍查詢(得到所有符合條件記錄的ROWID)
和下一步同過ROWID訪問表得到LODGING列的值.
由於LODGING$MANAGER是一個(gè)非唯一性的索引,資料庫(kù)不能對(duì)它執(zhí)行索引唯一掃描.
 
由於SQL返回LODGING列,而它並不存在於LODGING$MANAGER索引中,
所以在索引範(fàn)圍查詢後會(huì)執(zhí)行一個(gè)通過ROWID訪問表的操作.
 
WHERE子句中, 假如索引列所對(duì)應(yīng)的值的第一個(gè)字元由通配符(WILDCARD)開始, 索引將不被採(cǎi)用.
 
SELECT LODGING
FROM LODGING
WHERE MANAGER LIKE ‘%HANMAN’;
 
在這種情況下,ORACLE將使用全表掃描.
27. 基礎(chǔ)表的選擇
基礎(chǔ)表(Driving Table)是指被最先訪問的表(通常以全表掃描的方式被訪問). 根據(jù)優(yōu)化器的不同,
SQL語(yǔ)句中基礎(chǔ)表的選擇是不一樣的.
假如你使