數(shù)據(jù)倉庫指南
2024-07-21 02:09:26
供稿:網(wǎng)友
數(shù)據(jù)倉庫學習心得
一.概念
1.數(shù)據(jù)倉庫:是指面向主題的,一致的,不同時間的,穩(wěn)定的數(shù)據(jù)集合,用于支持經(jīng)營管理中的決策支持過程。從廣義上講數(shù)據(jù)倉庫是指存儲大量歷史數(shù)據(jù)的數(shù)據(jù)庫。每一個記錄代表特殊時間點上的一個數(shù)據(jù)。
它是一種把收集的各種數(shù)據(jù)轉變成有商業(yè)價值的信息技術,并把收集的信息體現(xiàn)在報告中。包括收集數(shù)據(jù),過濾數(shù)據(jù),存儲數(shù)據(jù),之后把數(shù)據(jù)應用于分析、報告等應用程序。
2.數(shù)據(jù)倉庫目標:確認數(shù)據(jù)結構,尋找趨勢,輔助決策,為經(jīng)營管理提供決策信息。
3..dss:決策支持過程。
4.數(shù)據(jù)倉庫組成部分:數(shù)據(jù)市場,關系型數(shù)據(jù)庫,數(shù)據(jù)源,數(shù)據(jù)準備,種服務工具
5.維度:
6.多維:
7.聚合:獲取并集中一個群體或總和的結構.聚合是在一個多維層次內移動數(shù)據(jù)的概念.
9.類別:為類別和區(qū)分特定數(shù)據(jù)而分類的,在一個維度內,為提供詳細分類系統(tǒng)而定義的分類.
10.詳細類別:一個維度內最底層的分類.
11.分解與合成:
12.指標量:
13.olap:聯(lián)機分析
14.oltp聯(lián)機事務處理
二.數(shù)據(jù)模型規(guī)范化
1. 概念:
規(guī)范化:是一個正規(guī)的方法,它應用一套規(guī)則使屬性和實體相關聯(lián)。
實體:是一個主要的數(shù)據(jù)對象,對用戶至關重要。它通常是將被記錄在數(shù)據(jù)庫中的一個人、一個地點、一樣東西或者一件事情。
屬性:實體包括屬性,屬性就是特征,修飾成分、質量、數(shù)量或者特性。
范式:規(guī)范化由幾個能夠減少褓以獲得更滿意的物理我的步驟組成,這些步驟稱為范式。
第一范式:一個不包含重復列的表歸于第一范式。
第二范式:如果一個表歸于第一范式且只包含依賴于主鍵的列,則歸于第二范式。
第三范式:如果一個表歸于第二范式且只包含那些非傳遞性地依賴于主鍵的列,則歸于第三范式。
二.信息需求建模:
1.自上而下建模方法:利用具體數(shù)據(jù)元素,將這些元素組織到各個維度與指標中,
2.自下而上建模方法:從用戶的觀點設計,優(yōu)點是設計者可以轉紙一個通常主題或商務領域運
3.開發(fā). 是自上而下與自下而上的方法的結合.
4.舉例:銷售收入應從預算和實際等角度表示.
指標:產(chǎn)品銷售的實際收入,產(chǎn)品銷售的預算收,產(chǎn)品銷售的估計收
維度:已經(jīng)銷售的產(chǎn)品.
三.設計數(shù)據(jù)倉庫,經(jīng)常詢部用戶的幾個問題?
1.用戶所在部門承擔的任務
2.用戶在部門中承擔的任務
3.為完成任務,用戶需哪些報表
4.目前從何處獲取這些信息?
5.得到信息如何處理?
6.信息是應用戶需要產(chǎn)生的,還是在定期報表中產(chǎn)生的?
7.用戶把信息輸入到過工作表中嗎?以便進一步分析嗎?
8.怎樣處理這些信息才算及時?
信息包的編制:
信息包:________________________
維度:____________________________________________
類別:
指標(預測銷售,實際銷售,預測偏差)
四.建立多維數(shù)據(jù)模型
要建立多維數(shù)據(jù)庫:
1. 選擇用來分析被建模主題的商業(yè)過程。
建模主題:比如想通過產(chǎn)品線和地區(qū)分析消費者的購買傾向來制訂市場策略,此時數(shù)據(jù)模型主題就是“銷售”。
2. 確定事實表的粒度。
事實表粒度通常代表每一個相關維的最底層。選擇以“天”為粒度,就表示“時間維”中的每一記錄代表一天。
3. 區(qū)分每一個事實表的維和層。
已定義的粒度與維相關。
4. 區(qū)分事實表的度量。
度量不僅包括數(shù)據(jù)本身,而且包括你從已存在的數(shù)據(jù)計算得到的新值。當設計數(shù)據(jù)模型時,必須做出決策:是否儲存事實表里的計算結果或在運行階段獲得這些值。如:比值。
5. 確定每一個維表的屬性。
一般情況下,定義的每一個維表屬性的數(shù)量,應該保持最小。
6. 讓用戶驗證數(shù)據(jù)模型。
歡迎您給我發(fā)email , 讓我們共同進步。
mailto: [email protected] [email protected] [email protected]
本文來源于網(wǎng)頁設計愛好者web開發(fā)社區(qū)http://www.html.org.cn收集整理,歡迎訪問。