国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python利用sklearn包編寫決策樹源代碼

2020-02-16 11:14:54
字體:
來源:轉載
供稿:網友

本文實例為大家分享了python編寫決策樹源代碼,供大家參考,具體內容如下

因為最近實習的需要,所以用python里的sklearn包重新寫了一次決策樹。

工具:sklearn,將dot文件轉化為pdf格式(是為了將形成的決策樹可視化)graphviz-2.38,下載解壓之后將其中的bin文件的目錄添加進環境變量

源代碼如下:

from sklearn.feature_extraction import DictVectorizerimport csvfrom sklearn import treefrom sklearn import preprocessingfrom sklearn.externals.six import StringIOfrom xml.sax.handler import feature_external_gesfrom numpy.distutils.fcompiler import dummy_fortran_file# Read in the csv file and put features into list of dict and list of class labelallElectronicsData = open(r'E:/DeepLearning/resources/AllElectronics.csv', 'rt')reader = csv.reader(allElectronicsData)headers = next(reader)featureList = []lableList = []for row in reader:lableList.append(row[len(row)-1])rowDict = {}#不包括len(row)-1for i in range(1,len(row)-1):rowDict[headers[i]] = row[i]featureList.append(rowDict)print(featureList)vec = DictVectorizer()dummX = vec.fit_transform(featureList).toarray()print(str(dummX))lb = preprocessing.LabelBinarizer()dummY = lb.fit_transform(lableList)print(str(dummY))#entropy=>ID3clf = tree.DecisionTreeClassifier(criterion='entropy')clf = clf.fit(dummX, dummY)print("clf:"+str(clf))#可視化treewith open("resultTree.dot",'w')as f:f = tree.export_graphviz(clf, feature_names=vec.get_feature_names(),out_file = f)#對于新的數據怎樣來查看它的分類oneRowX = dummX[0,:]print("oneRowX: "+str(oneRowX))newRowX = oneRowXnewRowX[0] = 1newRowX[2] = 0predictedY = clf.predict(newRowX)print("predictedY: "+ str(predictedY))

這里的AllElectronics.csv,形式如下圖所示:

今天早上好不容易將jdk、eclipse以及pydev裝進linux,但是,但是,但是,想裝numpy的時候,總是報錯,發現是沒有gcc,然后又去裝gcc,真是醉了,到現在gcc還是沒有裝成功,再想想方法

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 江北区| 贵德县| 高碑店市| 安吉县| 顺义区| 罗田县| 新密市| 金溪县| 长宁县| 闽侯县| 班戈县| 宽甸| 苏尼特右旗| 额尔古纳市| 深圳市| 吴江市| 郴州市| 保山市| 册亨县| 安顺市| 兰州市| 钟山县| 孙吴县| 都兰县| 柳州市| 专栏| 卢氏县| 太原市| 平陆县| 松阳县| 南召县| 浙江省| 雅江县| 楚雄市| 原阳县| 抚远县| 泗水县| 镇原县| 南康市| 米易县| 房产|