国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > 綜合 > 正文

ZT:數據倉庫常見名詞淺釋

2024-07-21 02:06:59
字體:
來源:轉載
供稿:網友

商業源碼熱門下載www.html.org.cn


zt:數據倉庫常見名詞淺釋


    data warehouse本世紀80年代中期,"數據倉庫之父"william h.inmon先生在其《建立數據倉庫》一書中定義了數據倉庫的概念,隨后又給出了更為精確的定義:數據倉庫是在企業管理和決策中面向主題的、集成的、與時間相關的、不可修改的數據集合。與其他數據庫應用不同的是,數據倉庫更像一種過程,對分布在企業內部各處的業務數據的整合、加工和分析的過程。而不是一種可以購買的產品。data mart數據集市,或者叫做"小數據倉庫"。如果說數據倉庫是建立在企業級的數據模型之上的話。那么數據集市就是企業級數據倉庫的一個子集,他主要面向部門級業務,并且只是面向某個特定的主題。數據集市可以在一定程度上緩解訪問數據倉庫的瓶頸。

olap聯機分析處理(olap)的概念最早是由關系數據庫之父e.f.codd于1993年提出的。當時,codd認為聯機事務處理(oltp)已不能滿足終端用戶對數據庫查詢分析的需要,sql對大數據庫進行的簡單查詢也不能滿足用戶分析的需求。用戶的決策分析需要對關系數據庫進行大量計算才能得到結果,而查詢的結果并不能滿足決策者提出的需求。因此codd提出了多維數據庫和多維分析的概念,即olap。

    codd提出olap的12條準則來描述olap系統:

  準則1 olap模型必須提供多維概念視圖
  準則2 透明性準則
  準則3 存取能力推測
  準則4 穩定的報表能力
  準則5 客戶/服務器體系結構
  準則6 維的等同性準則
  準則7 動態的稀疏矩陣處理準則
  準則8 多用戶支持能力準則
  準則9 非受限的跨維操作
  準則10 直觀的數據操縱
  準則11 靈活的報表生成
  準則12 不受限的維與聚集層次rolap

基于codd的12條準則,各個軟件開發廠家見仁見智,其中一個流派,認為可以沿用關系型數據庫來存儲多維數據,于是,基于稀疏矩陣表示方法的星型結構(star schema)就出現了。后來又演化出雪花結構。為了與多維數據庫相區別,則把基于關系型數據庫的olap稱為relational olap,簡稱rolap。代表產品有informix metacube、microsoft sql server olap services。

molaparbor software嚴格遵照codd的定義,自行建立了多維數據庫,來存放聯機分析系統數據,開創了多維數據存儲的先河,后來的很多家公司紛紛采用多維數據存儲。被人們稱為muiltdimension olap,簡稱molap,代表產品有hyperion(原arbor software) essbase、showcase strategy等。client olap相對于server olap而言。部分分析工具廠家建議把部分數據下載到本地,為用戶提供本地的多維分析。代表產品有brio designer,business object。

dss決策支持系統(decision support system),相當于基于數據倉庫的應用。決策支持就是在收集所有有關數據和信息,經過加工整理,來為企業決策管理層提供信息,為決策者的決策提供依據。

etl數據抽取(extract)、轉換(transform)、清洗(cleansing)、裝載(load)的過程。構建數據倉庫的重要一環,用戶從數據源抽取出所需的數據,經過數據清洗,最終按照預先定義好的數據倉庫模型,將數據加載到數據倉庫中去。

ad hoc query即席查詢,數據庫應用最普遍的一種查詢,利用數據倉庫技術,可以讓用戶隨時可以面對數據庫,獲取所希望的數據。

eis領導信息系統(executive information system),指為了滿足無法專注于計算機技術的領導人員的信息查詢需求,而特意制定的以簡單的圖形界面訪問數據倉庫的一種應用。

bpr業務流程重整(business process reengineering),指利用數據倉庫技術,發現并糾正企業業務流程中的弊端的一項工作,數據倉庫的重要作用之一。

bi商業智能(business intelligence),指數據倉庫相關技術與應用的通稱。指利用各種智能技術,來提升企業的商業競爭力。

data mining數據挖掘,data mining是一種決策支持過程,它主要基于ai、機器學習、統計學等技術,高度自動化地分析企業原有的數據,做出歸納性的推理,從中挖掘出潛在的模式,預測客戶的行為,幫助企業的決策者調整市場策略,減少風險,做出正確的決策

crm客戶關系管理(customer relationship management),數據倉庫是以數據庫技術為基礎但又與傳統的數據庫應用有著本質區別的新技術,crm就是基于數據倉庫技術的一種新應用。但是,從商業運作的角度來講,crm其實應該算是一個古老的"應用"了。比如,酒店對客人信息的管理,如果某個客人是某酒店的老主顧,那么該酒店很自然地會知道這位客人的某些習慣和喜好,如是否喜歡靠路邊,是否吸煙,是否喜歡大床,喜歡什么樣的早餐,等等。當客人再次光臨時,不用客人自己提出來,酒店就會提供客人所喜歡的房間和服務。這就是一種crm。

meta data元數據,關于數據倉庫的數據,指在數據倉庫建設過程中所產生的有關數據源定義,目標定義,轉換規則等相關的關鍵數據。同時元數據還包含關于數據含義的商業信息,所有這些信息都應當妥善保存,并很好地管理。為數據倉庫的發展和使用提供方便。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 双桥区| 伊宁县| 通榆县| 哈尔滨市| 成都市| 仁布县| 房产| 沽源县| 涪陵区| 湘西| 普兰县| 连云港市| 定襄县| 应用必备| 休宁县| 平远县| 六盘水市| 城步| 兴义市| 修武县| 锡林郭勒盟| 贡山| 仪陇县| 繁峙县| 高平市| 宜君县| 阳春市| 绍兴市| 阳春市| 澜沧| 饶河县| 夏河县| 化德县| 丰都县| 敦煌市| 仙居县| 大余县| 无棣县| 星子县| 黄浦区| 昭通市|