本文實例為大家分享了python實現決策樹分類算法的具體代碼,供大家參考,具體內容如下
1、概述
決策樹(decision tree)——是一種被廣泛使用的分類算法。
相比貝葉斯算法,決策樹的優勢在于構造過程不需要任何領域知識或參數設置
在實際應用中,對于探測式的知識發現,決策樹更加適用。
2、算法思想
通俗來說,決策樹分類的思想類似于找對象。現想象一個女孩的母親要給這個女孩介紹男朋友,于是有了下面的對話:
女兒:多大年紀了?
母親:26。
女兒:長的帥不帥?
母親:挺帥的。
女兒:收入高不?
母親:不算很高,中等情況。
女兒:是公務員不?
母親:是,在稅務局上班呢。
女兒:那好,我去見見。
這個女孩的決策過程就是典型的分類樹決策。
實質:通過年齡、長相、收入和是否公務員對將男人分為兩個類別:見和不見
假設這個女孩對男人的要求是:30歲以下、長相中等以上并且是高收入者或中等以上收入的公務員,那么這個可以用下圖表示女孩的決策邏輯

上圖完整表達了這個女孩決定是否見一個約會對象的策略,其中:
◊綠色節點表示判斷條件
◊橙色節點表示決策結果
◊箭頭表示在一個判斷條件在不同情況下的決策路徑
圖中紅色箭頭表示了上面例子中女孩的決策過程。
這幅圖基本可以算是一顆決策樹,說它“基本可以算”是因為圖中的判定條件沒有量化,如收入高中低等等,還不能算是嚴格意義上的決策樹,如果將所有條件量化,則就變成真正的決策樹了。
決策樹分類算法的關鍵就是根據“先驗數據”構造一棵最佳的決策樹,用以預測未知數據的類別
決策樹:是一個樹結構(可以是二叉樹或非二叉樹)。其每個非葉節點表示一個特征屬性上的測試,每個分支代表這個特征屬性在某個值域上的輸出,而每個葉節點存放一個類別。使用決策樹進行決策的過程就是從根節點開始,測試待分類項中相應的特征屬性,并按照其值選擇輸出分支,直到到達葉子節點,將葉子節點存放的類別作為決策結果。
3、決策樹構造
假如有以下判斷蘋果好壞的數據樣本:
樣本 紅 大 好蘋果
新聞熱點
疑難解答