国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發(fā) > 綜合 > 正文

如何將數(shù)據(jù)倉庫與系統(tǒng)體系結(jié)構(gòu)合成一體

2024-07-21 02:43:36
字體:
供稿:網(wǎng)友
本文簡單介紹了使用Microsoft數(shù)據(jù)倉庫架構(gòu)的數(shù)據(jù)倉庫,討論了數(shù)據(jù)倉庫能夠?qū)崿F(xiàn)的功能,使用數(shù)據(jù)倉庫的恰當(dāng)時(shí)機(jī),以及如何將數(shù)據(jù)倉庫與系統(tǒng)體系結(jié)構(gòu)合成一體。

簡介

1998 年發(fā)布的 7.0 版 Microsoft® SQL Server™ 中已經(jīng)包含數(shù)據(jù)倉庫軟件。如果您對(duì)數(shù)據(jù)倉庫比較陌生,您可能會(huì)問:“它能夠干什么?什么時(shí)候使用數(shù)據(jù)倉庫比較合適?怎樣才能將數(shù)據(jù)倉庫與系統(tǒng)體系結(jié)構(gòu)合為一體?”本文將簡要介紹使用 Microsoft 數(shù)據(jù)倉庫架構(gòu)的數(shù)據(jù)倉庫。

數(shù)據(jù)倉庫

在軟件行業(yè)相對(duì)短暫的歷史中,數(shù)據(jù)庫已經(jīng)成為收集和分布信息的系統(tǒng)的基礎(chǔ)。這些數(shù)據(jù)庫深層隱藏的是統(tǒng)計(jì)學(xué)或測量方法,戰(zhàn)略家們可以對(duì)其進(jìn)行研究,以提高系統(tǒng)的整體效率。數(shù)據(jù)采集是這類信息的重要部分,目的在于根據(jù)數(shù)據(jù)庫內(nèi)容進(jìn)行正確決策。直到最近,這種努力還需要昂貴而笨重的數(shù)據(jù)采集軟件包,或能夠?qū)⑿畔⒄?qǐng)求精確翻譯成可使用的、更有效的查詢的數(shù)據(jù)庫專家。除特大型的機(jī)構(gòu)以外,對(duì)其他所有人來說,這兩種方案的成本都極為昂貴。

就數(shù)據(jù)采集的目的而言,能夠有效用于產(chǎn)品分類、庫存控制和訂單條目系統(tǒng)的普通關(guān)系數(shù)據(jù)庫可能并不是最佳的設(shè)計(jì)。跨表和跨數(shù)據(jù)庫(有時(shí)甚至是跨服務(wù)器)匯總輸出可能會(huì)非常復(fù)雜,而這種復(fù)雜是可以避免的。需要進(jìn)行數(shù)據(jù)采集時(shí),創(chuàng)建一個(gè)可供數(shù)據(jù)分析查詢用的信息中心儲(chǔ)備庫將更有意義。這就是數(shù)據(jù)倉庫的含義。來自系統(tǒng)不同部分的信息被集成到數(shù)據(jù)倉庫中,以便于訪問。

作為數(shù)據(jù)倉庫模型的立方體

用立方體作為數(shù)據(jù)倉庫儲(chǔ)備庫的名稱雖然不完美,但比較令人滿意。如何區(qū)分?jǐn)?shù)據(jù)倉庫立方體和幾何立方體呢?這兩種立方體之間存在幾個(gè)重要的不同之處。數(shù)據(jù)倉庫立方體由任意數(shù)量的維度定義(并不限于三維,有時(shí)數(shù)據(jù)倉庫立方體可能少于三維)。描述數(shù)據(jù)倉庫立方體的維度與描述幾何立方體的長、寬和高一樣。如果需要,可以將維度組合成任意數(shù)量的級(jí)別。

兩維間的關(guān)系可以用網(wǎng)格定型。維度類似于網(wǎng)格坐標(biāo)軸上的標(biāo)記。單元格才是內(nèi)容。內(nèi)容對(duì)應(yīng)于立方體每個(gè)維度的交叉結(jié)果。單元格中的數(shù)據(jù)是一個(gè)計(jì)量單位。計(jì)量單位是判斷立方體的全部依據(jù)。如果立方體是關(guān)于售出項(xiàng)目的數(shù)目,則計(jì)量單位就是已出售項(xiàng)目數(shù)量的計(jì)數(shù)。要重復(fù)網(wǎng)格示例,計(jì)量單位便是您在網(wǎng)格單元格中找到的數(shù)目。

圖 1:上圖顯示的是兩維立方體的組織結(jié)構(gòu)。在該示例中,“產(chǎn)品”和“地區(qū)”是維度;“椰菜”、“肥皂”、“俄勒岡”、“華盛頓”、“西雅圖”和“斯波坎”是各個(gè)維度的級(jí)別。包含不同圖表的單元格就是內(nèi)容。內(nèi)容單元格中的單個(gè)數(shù)據(jù)就是計(jì)量值。在該示例中,立方體中共使用了三種計(jì)量單位。

維度和級(jí)別

對(duì)于為雜貨店設(shè)計(jì)的數(shù)據(jù)倉庫立方體,其維度可能包括產(chǎn)品、優(yōu)惠、時(shí)間(營業(yè)天數(shù))和地區(qū)等內(nèi)容。可能還包括雇員維度和客戶維度(某些雜貨店可能有會(huì)員帳戶)。

級(jí)別用于將維度按需要組織為更小的單位。根據(jù)級(jí)別在立方體中的配置,它們還可能包含其他級(jí)別。例如,假設(shè)有一個(gè)區(qū)域維。也許這個(gè)雜貨店在三個(gè)州營業(yè),并且使用州界作為分界線。假設(shè)區(qū)域維包含三個(gè)級(jí)別:加利福尼亞、俄勒岡和華盛頓。如果該店在華盛頓州還包括其他子區(qū)域(例如西雅圖、奧林匹亞、亞基馬和斯波坎),即使加利福尼亞和俄勒岡區(qū)域沒有這樣的情況,這些級(jí)別仍可以作為子級(jí)別添加到華盛頓區(qū)域。級(jí)別只是組織維度內(nèi)容的一種便利方法。

內(nèi)容和計(jì)量單位

內(nèi)容是由各個(gè)維度組合而成的。定位內(nèi)容類似于使用坐標(biāo)系。就象數(shù)學(xué)立方體中的原點(diǎn)可以表示為 (x=0,y=0,z=0),內(nèi)容將由特定的維度組合(例如 (PRoduct=broccoli, Region=Seattle, Time=Wednesday))表示,生成一個(gè)有關(guān)星期三在西雅圖銷售椰菜的內(nèi)容。根據(jù)立方體的使用方法,內(nèi)容可能顯示一個(gè)類似于“售出 580 單位物品”或“銷售額為 $860.00”的計(jì)量單位。計(jì)量單位的含義取決于立方體的定義方式。在本例中,可能有多種椰菜或在西雅圖地區(qū)有多個(gè)商店。該值將表示定義組的匯總。立方體內(nèi)的計(jì)量單位可能是數(shù)字。對(duì)于一個(gè)雜貨店,計(jì)量單位可能會(huì)是產(chǎn)品價(jià)格、凈銷售額、銷售數(shù)量、商品成本等。

匯總

計(jì)數(shù)和總計(jì)的數(shù)學(xué)運(yùn)算是數(shù)據(jù)倉庫之所以有用的重要原因之一,屬于匯總功能。維度組織完畢并已對(duì)立方體進(jìn)行處理后,將開始計(jì)算匯總。通常,在立方體初始填充后或?qū)α⒎襟w的內(nèi)容進(jìn)行更改后,將立刻進(jìn)行匯總。

使用數(shù)據(jù)倉庫進(jìn)行決策

假設(shè)一個(gè)雜貨店的情形。假定某種促銷已經(jīng)進(jìn)行了好幾天,店主需要決定是否要再次進(jìn)行促銷。店主可能會(huì)產(chǎn)生如下疑問:“促銷期間賣出的產(chǎn)品比促銷前賣出的產(chǎn)品多嗎?”

在使用普通結(jié)構(gòu)的事務(wù)數(shù)據(jù)庫中,雜貨店庫存系統(tǒng)可以記錄價(jià)格、產(chǎn)品、銷售和促銷等情況。庫存系統(tǒng)在插入和更新記錄方面進(jìn)行了優(yōu)化,并且在簡單的程式化選擇(如檢索項(xiàng)目成本)方面可能也進(jìn)行了優(yōu)化。這種情況是不太可能的:系統(tǒng)的組織方式使得所生成的報(bào)告可以按天或按產(chǎn)品詳細(xì)描述某種銷售的有效性。事實(shí)上,為事務(wù)有效性而設(shè)計(jì)的系統(tǒng)和為查詢有效性而設(shè)計(jì)的系統(tǒng)間總是存在矛盾。這種情況下,就應(yīng)該使用數(shù)據(jù)倉庫。數(shù)據(jù)倉庫是一個(gè)獨(dú)立的存儲(chǔ)庫,它使用已進(jìn)行優(yōu)化的結(jié)構(gòu)中現(xiàn)有資源的相關(guān)數(shù)據(jù)。

在此例中,使用數(shù)據(jù)倉庫將很容易回答店主的問題。通過使用產(chǎn)品、促銷和時(shí)間立方體維度,計(jì)量項(xiàng)目銷售量的內(nèi)容記錄總和便可以生成所需的結(jié)果。

與此技術(shù)相比,其他系統(tǒng)中的信息甚至可能不在同一數(shù)據(jù)庫中。庫存數(shù)據(jù)源可能和客戶數(shù)據(jù)源或雇員數(shù)據(jù)源不一樣。即使該系統(tǒng)位于同一數(shù)據(jù)庫中,建立一個(gè)查詢系統(tǒng)(該系統(tǒng)以一種可以生成正確答案的方式合并和匯總結(jié)果)也是非常繁瑣的。事實(shí)上,合并數(shù)據(jù)源和匯總結(jié)果正是數(shù)據(jù)倉庫軟件最擅長的。

FoodMart 示例立方體包含在 Microsoft SQL Server Analysis Services 軟件,即 Microsoft 的數(shù)據(jù)倉庫軟件中。對(duì)于了解使用數(shù)據(jù)倉庫時(shí)可以使用什么樣的信息,這是一個(gè)非常好的資源。FoodMart 示例使用雜貨店作為模型。

查看立方體片段和編程接口

雖然將數(shù)據(jù)倉庫構(gòu)建成多維可能是簡單的設(shè)計(jì)選擇,并且對(duì)于處理器來說,執(zhí)行跨越多個(gè)維度生成結(jié)果的查詢也不是特別的復(fù)雜,但是多維輸出的結(jié)構(gòu)顯示起來卻非常困難。圖表、圖形和表格通常都是使用兩維顯示的。雖然有一些好的三維圖表工具,但圖表會(huì)變得難以看懂。查看多維輸出的常用技術(shù)是一次查看立方體的一個(gè)兩維輸出“片段”。這也是 Microsoft SQL Server Analysis Tool 顯示輸出的方式。

使用 DSO

幸運(yùn)的是,輸出并不局限于兩維。Microsoft SQL Server Analysis Services 為多維數(shù)據(jù)倉庫輸出提供了編程接口:DSO,決策支持對(duì)象 (Decision Support Object)。DSO 能夠用于編程訪問多個(gè)維度。

使用 MDX

MDX(多維擴(kuò)展)是為查詢多維對(duì)象和數(shù)據(jù)而設(shè)計(jì)的語法。對(duì)這樣的系統(tǒng)來說,使用 MDX 要比使用 SQL(為完全不同的對(duì)象集而設(shè)計(jì))更有效也更有意義。MDX 查詢的語法與 SQL 查詢的語法類似。請(qǐng)注意觀察下面的 MDX 查詢,它將選用前面示例中的銷售數(shù)字(星期三在西雅圖銷售的椰菜):

SELECT [Measures].[Sales] ON COLUMNS [Time].[Wednesday] ON ROWS FROM MySalesCube WHERE [Region].[Washington].[Seattle] AND [Product].[Vegetable].[Broccholi]本查詢的輸出為一個(gè)標(biāo)記有“銷售額”的列,標(biāo)記有“星期三”的行和交叉處包含銷售數(shù)字“$860.00”的網(wǎng)格單元格。

SQL Server Analysis Server Manager 包含一個(gè)接收 MDX 查詢的接口。此外,MDX 查詢也可以被集成到使用 DSO 的程序中。

Microsoft 數(shù)據(jù)倉庫架構(gòu)

Microsoft 數(shù)據(jù)倉庫架構(gòu)是一個(gè)易于集成到當(dāng)前系統(tǒng)的開放式體系結(jié)構(gòu)。Microsoft SQL Server DTS 工具用于導(dǎo)入、導(dǎo)出以及修復(fù)或轉(zhuǎn)換數(shù)據(jù)(如果需要)。該架構(gòu)包含一個(gè)用于自定義數(shù)據(jù)倉庫實(shí)現(xiàn)的、以對(duì)象為中心的編程接口。還有一個(gè)用戶接口,即 Microsoft SQL Server Analysis Services Manager,可用于配置數(shù)據(jù)倉庫并填寫或更新立方體中的內(nèi)容。它可用于安排任務(wù)、監(jiān)視性能以及對(duì)數(shù)據(jù)倉庫執(zhí)行查詢。

數(shù)據(jù)倉庫的其他應(yīng)用

對(duì)于決策支持,數(shù)據(jù)倉庫是一個(gè)了不起的工具,但該軟件還具有其他實(shí)際用途。

數(shù)據(jù)歸檔便是其中一種用法。某些系統(tǒng)的存儲(chǔ)能力可能有限。因此需要經(jīng)常從這些系統(tǒng)中刪除舊數(shù)據(jù),以便容納新數(shù)據(jù)。如果需要?dú)w檔信息以便保存長期的歷史報(bào)表,請(qǐng)考慮將部分舊數(shù)據(jù)存入數(shù)據(jù)倉庫。

數(shù)據(jù)倉庫將報(bào)告數(shù)據(jù)從運(yùn)行系統(tǒng)中隔離出來。通過將查詢工作移動(dòng)到更有效率的系統(tǒng),這種隔離能夠提高運(yùn)行系統(tǒng)的性能。可以提高安全性。敏感信息將保存在不會(huì)暴露給查詢的運(yùn)行數(shù)據(jù)庫中。由數(shù)據(jù)倉庫提供的提取級(jí)別簡化了對(duì)決策支持應(yīng)用程序生成的統(tǒng)計(jì)表的訪問。

實(shí)現(xiàn)數(shù)據(jù)倉庫易犯的錯(cuò)誤

數(shù)據(jù)倉庫可能在幾個(gè)方面使商業(yè)進(jìn)程明顯復(fù)雜化。

它們倚賴于其他系統(tǒng)。如果數(shù)據(jù)倉庫所倚賴的數(shù)據(jù)源有所更改(例如,該數(shù)據(jù)源不再可用或已被新系統(tǒng)代替),那么也需要對(duì)向數(shù)據(jù)倉庫傳送數(shù)據(jù)的進(jìn)程進(jìn)行修改。設(shè)計(jì)一個(gè)向數(shù)據(jù)倉庫傳送數(shù)據(jù)的進(jìn)程是創(chuàng)建數(shù)據(jù)倉庫過程中最費(fèi)時(shí)間的任務(wù)。

有用數(shù)據(jù)的可用性非常關(guān)鍵。有時(shí)數(shù)據(jù)源內(nèi)容對(duì)于決策支持沒有什么用處。如果數(shù)據(jù)源是臨時(shí)性的,或者帶有未定義結(jié)構(gòu),或者內(nèi)容變化得太快,這些都將降低數(shù)據(jù)倉庫所需的穩(wěn)定性。創(chuàng)建數(shù)據(jù)倉庫并不能解決有用數(shù)據(jù)收集過程中的問題。

總結(jié)

Microsoft 數(shù)據(jù)倉庫架構(gòu)提供了構(gòu)造、填充、查看和訪問數(shù)據(jù)倉庫的工具。數(shù)據(jù)倉庫軟件的基本單位是立方體,它是來自現(xiàn)有數(shù)據(jù)源的集成信息儲(chǔ)備庫。


發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 郑州市| 满城县| 息烽县| 奉新县| 伊春市| 乡城县| 偃师市| 孝感市| 循化| 永修县| 兴业县| 昌平区| 涿州市| 武强县| 朝阳县| 茌平县| 桐庐县| 田东县| 保德县| 丹寨县| 灌云县| 榕江县| 共和县| 佳木斯市| 齐河县| 大渡口区| 崇阳县| 罗定市| 定边县| 文登市| 乌兰察布市| 高要市| 英德市| 宁南县| 神农架林区| 密山市| 兴文县| 黑龙江省| 鹤庆县| 曲周县| 泰州市|