詳細介紹 Oracle 數據庫的聚簇技術
2024-08-29 13:35:46
供稿:網友
 
             1. 什么是聚簇 聚簇是根據碼值找到數據的物理存儲位置,從而達到快速檢索數據的目的。聚簇索引的順序就是數據的物理存儲順序,葉節點就是數據節點。                                                                                            非聚簇索引的順序與數據物理排列順序無關,葉節點仍然是索引節點,只不過有一個指針指向對應的數據塊。一個表最多只能有一個聚簇索引。 2. 使用 Oracle 聚簇索引 聚簇是一種存儲表的方法,這些表密切相關并經常一起連接進磁盤的同一區域。例如,表 BOOKSHELF 和BOOKSHELF_AUTHOR 數據行可以一起插入到稱為簇(Cluster)的單個區域中,而不是將兩個表放在磁盤上的不同扇區上。簇鍵(Cluster Key)可以是一列或多列,通過這些列可以將這些表在查詢中連接起來(例如,BOOKSHELF表和BOOKSHELF_AUTHOR表中的 Title列)。為了將表聚集在一起,必須擁有這些將要聚集在一起的表。 下面是create cluster命令的基本格式: create cluster (column datatype [, column datatype]...) [other options];cluster的名字遵循表命名約定,column datatype是將作為簇鍵使用的名字和數據類型。column的名字可以與將要放進該簇中的表的一個列名相同,或者為其他有效名字。下面是一個例子: create cluster BOOKandAUTHOR (Col1 VARCHAR2(100));這樣就建立了一個沒有任何內容的簇(象給表分配了一塊空間一樣)。COL1的使用對于簇鍵是不相干的,不會再使用它。但是,它的定義應該與要增加的表的主鍵相符。接下來,建立包含在該簇中的表: create table BOOKSHELF    (Title VARCHAR2(100) PRimary key,    Publisher VARCHAR2(20),    CategoryName VARCHAR2(20),    Rating VARCHAR2(2),    constraint CATFK foreign key (CategoryName) references CATEGORY(CategoryName)    )    cluster BOOKandAUTHOR(Title);在向BOOKSHELF表中插入數據行之前,必須建立一個聚簇索引: create index BOOKandAUTHORndx on cluster BOOKandAUTHOR;在上面的create table語句中,簇BOOKandAUTHOR(Title)子句放在表的列清單的閉括號的后面。BOOKandAUTHOR是前面建立的聚簇的名字。Title是將存儲到聚簇Col1中的該表的列。create cluster語句中可能會有多個簇鍵,并且在created table語句中可能有多個列存儲在這些鍵中。請注重,沒有任何語句明確說明Title列進入到Col1中。這種匹配僅僅是通過位置做到的,即Col1和Title都是在它們各自的簇語句中提到的第一個對象。多個列和簇鍵是第一個與第一個匹配,第二個與第二個匹配,第三個與第三個匹配,等等。現在,添加第二個表到聚簇中: create table BOOKSHELF_AUTHOR    (Title VARCHAR2(100),    AuthorName VARCHAR2(50),    constraint TitleFK Foreign key (Title) references BOOKSHELF(Title),    constraint AuthorNameFK Foreign key (AuthorName) references AUTHOR(AuthorName)    )    cluster BOOKandAUTHOR (Title);當這兩個表被聚在一起時,每個唯一的Title在簇中實際只存儲一次。對于每個Title,都從這兩個表中附加列。 來自這兩個表的數據實際上存放在一個位置上,就似乎簇是一個包含兩個表中的所有數據的大表一樣。 3. 散列聚簇 對于散列聚簇,它只有一個表。它通過散列算法求出存儲行的物理存儲位置,從而快速檢索數據。創建散列聚簇時要指定碼列的數據類型,數據行的大小及不同碼值的個數。假如碼值不是平均分布的,就可能有許多行存儲到溢出塊上,從而會降低查詢該表的SQL語句的性能。 散列聚簇被用在總是通過主鍵查詢數據的情況,例如要從表 T 查詢數據并且查詢語句總是是這樣: select * from T where id = :x;
                         這時散列聚簇是一個好的選擇,因為不需要索引。Oracle 將通過散列算法得到值 :x 所對應的物理地址,從而直接取到數據。不用進行索引掃描,只通過散列值進行一次表訪問。 散列聚簇語法示例: CREATE CLUSTER personnel    ( department_number NUMBER )    SIZE 512 HASHKEYS 500    STORAGE (INITIAL 100K NEXT 50K);    CREATE CLUSTER personnel    ( home_area_code NUMBER,    home_prefix NUMBER )    HASHKEYS 20    HASH IS MOD(home_area_code + home_prefix, 101);    CREATE CLUSTER personnel    (deptno NUMBER)    SIZE 512 SINGLE TABLE HASHKEYS 500;