當數(shù)據(jù)存儲在一個普通表中的時候,這些記錄將以插入到數(shù)據(jù)庫時的順序物理地保存到分配的塊中。例如,如果有一個用于存儲員工信息的表,那么員工姓名將會按照插入到表的順序存儲在表中。
如果員工記錄非常多的話,那么數(shù)據(jù)表的響應速度就會逐漸變慢。你可以通過選擇值相對等分布的一列(如員工的部門編號)并建立一個簇表來提高查詢員工的速度。
在簇表中,如果員工屬于同一個部門,那么它們的記錄將物理地存儲在同一系列的塊中。這樣就可以提高查找員工信息的速度,這是因為在檢索某個特定部門的員工時,需要讀取數(shù)據(jù)庫塊的數(shù)量減少了。而在非簇表中查找員工,就可能需要對每個數(shù)據(jù)庫塊進行訪問。
當表中存在大量鍵值的時候,你就會開始發(fā)現(xiàn)由于存在許多簇塊而導致的性能問題。避免這個問題的一個方法就是使用一個哈希函數(shù)來約束簇塊的數(shù)量。哈希函數(shù)將會給定一個數(shù)值用來限定簇塊數(shù)量的預計范圍,但它得到的值是相對等分布的。例如你可以創(chuàng)建一個哈希函數(shù),只比較部門編號的最后兩位。
哈希函數(shù)中存在的一個問題就是函數(shù)值會打亂記錄原本的順序。你可以通過 order by來解決這個問題;但是,在很多情況下,記錄數(shù)量是非常龐大的。在oracle 10g 中,你可以將一個數(shù)據(jù)定義為“natural order” ,那么就可以不用經(jīng)過排序而以你所希望的順序來檢索哈希簇的數(shù)據(jù),從而解決了上面的提出問題。
例如,假設(shè)你有一個信用卡業(yè)務(wù)的數(shù)據(jù)庫。你決定以信用卡號作為簇主鍵將有利于數(shù)據(jù)的存儲分布。但是,由于存在大量的信用卡號,所以可以使用一個哈希函數(shù)來約束簇塊的數(shù)量。而且你希望在你的大部分報表中數(shù)據(jù)是按照時間順序排列的,那么在進行每個查詢操作時使用排序哈希簇,而不要使用order by。下面給出了相關(guān)語句:
create cluster credit_cluster
(
card_no varchar2(16),
transdate date sort
)
hashkeys 10000 hash is ora_hash(card_no)
size 256;
create table credit_orders
(
card_no varchar2(16),
transdate date,
amount number
)
cluster credit_cluster(card_no,transdate);
alter session set nls_date_format = "yyyymmddhh24miss";
insert into credit_orders (card_no,transdate,amount)
values ('4111111111111111','20050131000123',57.99);
insert into credit_orders (card_no,transdate,amount)
values ('4111111111111111','20050130071216',16.59);
insert into credit_orders (card_no,transdate,amount)
values ('4111111111111111','20050131111111',39.00);
insert into credit_orders (card_no,transdate,amount)
values ('4111111111111111','20050130081001',25.16);
可以看到我在這里使用了一個新函數(shù)ora_hash 來為信用卡建立一個哈希數(shù)值。現(xiàn)在,你可以非常簡單地對某個信用卡數(shù)據(jù)進行查詢,并返回自動排序后的結(jié)果。
新聞熱點
疑難解答
圖片精選