国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > 綜合 > 正文

全面解析數據挖掘的分類及各種分析方法

2024-07-21 02:42:53
字體:
來源:轉載
供稿:網友
1.數據挖掘能做以下六種不同事情(分析方法):

· 分類 (Classification)

· 估值(Estimation)

· 預言(PRediction)

· 相關性分組或關聯規則(Affinity grouping or association rules)

· 聚集(Clustering)

· 描述和可視化(Des cription and Visualization)

· 復雜數據類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)

2.數據挖掘分類

以上六種數據挖掘的分析方法可以分為兩類:直接數據挖掘;間接數據挖掘

· 直接數據挖掘

目標是利用可用的數據建立一個模型,這個模型對剩余的數據,對一個特定的變量(可以理解成數據庫中表的屬性,即列)進行描述。

· 間接數據挖掘

目標中沒有選出某一具體的變量,用模型進行描述;而是在所有的變量中建立起某種關系 。

· 分類、估值、預言屬于直接數據挖掘;后三種屬于間接數據挖掘

3.各種分析方法的簡介

· 分類 (Classification)

首先從數據中選出已經分好類的訓練集,在該訓練集上運用數據挖掘分類的技術,建立分類模型,對于沒有分類的數據進行分類。

例子:

a. 信用卡申請者,分類為低、中、高風險

b. 分配客戶到預先定義的客戶分片

注意: 類的個數是確定的,預先定義好的

· 估值(Estimation)

估值與分類類似,不同之處在于,分類描述的是離散型變量的輸出,而估值處理連續值的輸出;分類的類別是確定數目的,估值的量是不確定的。

例子:

a. 根據購買模式,估計一個家庭的孩子個數

b. 根據購買模式,估計一個家庭的收入

c. 估計real estate的價值

一般來說,估值可以作為分類的前一步工作。給定一些輸入數據,通過估值,得到未知的連續變量的值,然后,根據預先設定的閾值,進行分類。例如:銀行對家庭貸款業務,運用估值,給各個客戶記分(Score 0~1)。然后,根據閾值,將貸款級別分類。

· 預言(Prediction)

通常,預言是通過分類或估值起作用的,也就是說,通過分類或估值得出模型,該模型用于對未知變量的預言。從這種意義上說,預言其實沒有必要分為一個單獨的類。預言其目的是對未來未知變量的預測,這種預測是需要時間來驗證的,即必須經過一定時間后,才知道預言準確性是多少。

· 相關性分組或關聯規則(Affinity grouping or association rules)

決定哪些事情將一起發生。

例子:

a. 超市中客戶在購買A的同時,經常會購買B,即A => B(關聯規則)

b. 客戶在購買A后,隔一段時間,會購買B (序列分析)

· 聚集(Clustering)

聚集是對記錄分組,把相似的記錄在一個聚集里。聚集和分類的區別是聚集不依賴于預先定義好的類,不需要訓練集。

例子:

a. 一些特定癥狀的聚集可能預示了一個特定的疾病

b. 租VCD類型不相似的客戶聚集,可能暗示成員屬于不同的亞文化群

聚集通常作為數據挖掘的第一步。例如,"哪一種類的促銷對客戶響應最好?",對于這一 類問題,首先對整個客戶做聚集,將客戶分組在各自的聚集里,然后對每個不同的聚集,回答問題,可能效果更好。

· 描述和可視化(Des cription and Visualization)

是對數據挖掘結果的表示方式。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 肇州县| 南安市| 连云港市| 正安县| 高清| 舒城县| 肇东市| 深州市| 平山县| 东莞市| 林芝县| 贵港市| 抚远县| 武乡县| 永安市| 手游| 合川市| 吐鲁番市| 通渭县| 瑞安市| 长武县| 政和县| 方山县| 耒阳市| 赣榆县| 东乡县| 富裕县| 托里县| 监利县| 北流市| 满洲里市| 乐陵市| 寻乌县| 拜泉县| 宁晋县| 楚雄市| 平谷区| 沁水县| 鄂伦春自治旗| 沾化县| 永川市|