46. 連接多個掃描
如果你對一個列和一組有限的值進行比較, 優化器可能執行多次掃描并對結果進行合并連接.
舉例:
select *
from lodging
where manager in (‘bill gates’,’ken muller’);
優化器可能將它轉換成以下形式
select *
from lodging
where manager = ‘bill gates’
or manager = ’ken muller’;
當選擇執行路徑時, 優化器可能對每個條件采用lodging$manager上的索引范圍掃描. 返回的rowid用來訪問lodging表的記錄 (通過table access by rowid 的方式). 最后兩組記錄以連接(concatenation)的形式被組合成一個單一的集合.
explain plan :
select statement optimizer=choose
concatenation
table access (by index rowid) of lodging
index (range scan ) of lodging$manager (non-unique)
table access (by index rowid) of lodging
index (range scan ) of lodging$manager (non-unique)
譯者按:
本節和第37節似乎有矛盾之處.
47. cbo下使用更具選擇性的索引
基于成本的優化器(cbo, cost-based optimizer)對索引的選擇性進行判斷來決定索引的使用是否能提高效率.
如果索引有很高的選擇性, 那就是說對于每個不重復的索引鍵值,只對應數量很少的記錄.
比如, 表中共有100條記錄而其中有80個不重復的索引鍵值. 這個索引的選擇性就是80/100 = 0.8 . 選擇性越高, 通過索引鍵值檢索出的記錄就越少.
如果索引的選擇性很低, 檢索數據就需要大量的索引范圍查詢操作和rowid 訪問表的
操作. 也許會比全表掃描的效率更低.
譯者按:
下列經驗請參閱:
a. 如果檢索數據量超過30%的表中記錄數.使用索引將沒有顯著的效率提高.
b. 在特定情況下, 使用索引也許會比全表掃描慢, 但這是同一個數量級上的
區別. 而通常情況下,使用索引比全表掃描要塊幾倍乃至幾千倍!
48. 避免使用耗費資源的操作
帶有distinct,union,minus,intersect,order by的sql語句會啟動sql引擎
執行耗費資源的排序(sort)功能. distinct需要一次排序操作, 而其他的至少需要執行兩次排序.
例如,一個union查詢,其中每個查詢都帶有group by子句, group by會觸發嵌入排序(nested sort) ; 這樣, 每個查詢需要執行一次排序, 然后在執行union時, 又一個唯一排序(sort unique)操作被執行而且它只能在前面的嵌入排序結束后才能開始執行. 嵌入的排序的深度會大大影響查詢的效率.
通常, 帶有union, minus , intersect的sql語句都可以用其他方式重寫.
譯者按:
如果你的數據庫的sort_area_size調配得好, 使用union , minus, intersect也是可以考慮的, 畢竟它們的可讀性很強
49. 優化group by
提高group by 語句的效率, 可以通過將不需要的記錄在group by 之前過濾掉.下面兩個查詢返回相同結果但第二個明顯就快了許多.
低效:
select job , avg(sal)
from emp
group job
having job = ‘president’
or job = ‘manager’
高效:
select job , avg(sal)
from emp
where job = ‘president’
or job = ‘manager’
group job
譯者按:
本節和14節相同. 可略過.
50. 使用日期
當使用日期是,需要注意如果有超過5位小數加到日期上, 這個日期會進到下一天!
例如:
1.
select to_date(‘01-jan-93’+.99999)
from dual;
returns:
’01-jan-93 23:59:59’
2.
select to_date(‘01-jan-93’+.999999)
from dual;
returns:
’02-jan-93 00:00:00’
譯者按:
雖然本節和sql性能優化沒有關系, 但是作者的功力可見一斑
51. 使用顯式的游標(cursors)
使用隱式的游標,將會執行兩次操作. 第一次檢索記錄, 第二次檢查too many rows 這個exception . 而顯式游標不執行第二次操作.
52. 優化export和import
使用較大的buffer(比如10mb , 10,240,000)可以提高export和import的速度.
oracle將盡可能地獲取你所指定的內存大小,即使在內存不滿足,也不會報錯.這個值至少要和表中最大的列相當,否則列值會被截斷.
譯者按:
可以肯定的是, 增加buffer會大大提高export , import的效率. (曾經碰到過一個case, 增加buffer后,import/export快了10倍!)
作者可能犯了一個錯誤: “這個值至少要和表中最大的列相當,否則列值會被截斷. “
其中最大的列也許是指最大的記錄大小.
關于export/import的優化,csdn論壇中有一些總結性的貼子,比如關于buffer參數, commit參數等等, 詳情請查.
53. 分離表和索引
總是將你的表和索引建立在不同的表空間內(tablespaces). 決不要將不屬于oracle內部系統的對象存放到system表空間里. 同時,確保數據表空間和索引表空間置于不同的硬盤上.
譯者按:
“同時,確保數據表空間和索引表空間置與不同的硬盤上.”可能改為如下更為準確 “同時,確保數據表空間和索引表空間置與不同的硬盤控制卡控制的硬盤上.”
(全文完)
black_snail
[email protected]
4/sep/2003