国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

使用python實(shí)現(xiàn)個(gè)性化詞云的方法

2019-11-25 16:05:28
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

先上圖片


詞云圖

需要模板

pip install jiebapip install wordcloud

還需要安裝另外兩個(gè)東西這兩個(gè)我也不太懂借鑒百度寫(xiě)上去的

pip install scipypip install matplotlib

因?yàn)橛胾buntu系統(tǒng)所有沒(méi)有windows那么麻煩,也沒(méi)有那么多報(bào)錯(cuò)

看到好多人制作自己的詞云有沒(méi)有一絲絲的激動(dòng)啊,有激動(dòng)就要馬上去做,沖動(dòng)才是第一創(chuàng)造力。

jieba是一款很恨很好用的中文分詞模板

jeiba中文文檔

至于wordcloud沒(méi)有中文文檔不過(guò)咱會(huì)猜啊,英文不好咱們可以猜啊,查看源代碼猜。

先把我全部代碼貢獻(xiàn)上來(lái)

#-*-coding:utf-8―-*-import jieba.analysefrom wordcloud import WordCloud,ImageColorGeneratorfrom scipy.misc import imreadimport matplotlib.pyplot as pltclass wc:  def __init__(self,txt_file,img_file,font_file):   self.f = open(txt_file,'r')  self.txt = self.f.read()   self.f.close()  self.tags = jieba.analyse.extract_tags(self.txt,topK=100)  #topK說(shuō)白了就是返回幾個(gè)關(guān)鍵詞  self.text = ' '.join(self.tags) #把分詞鏈接起來(lái),加空格因?yàn)橛⑽目靠崭穹衷~  self.img = imread(img_file)  self.wc = WordCloud(font_path=font_file,background_color='white',max_words=100,mask=self.img,max_font_size=80)###直接在這里進(jìn)行猜####font_path指的是字體文件路徑,因?yàn)閣ordcloud自帶的字體不支持中文所以我們要指定一個(gè)字體文件,否者輸出的圖片全是框框#background_color 默認(rèn)是黑色 我設(shè)置成白色#max_words最大顯示的詞數(shù)#mask 背景圖片#max_font_size 最大字體字號(hào)  self.word_cloud = self.wc.generate(self.text)  def show_wc(self):  #img_color = ImageColorGenerator(self.img)    plt.imshow(self.word_cloud)#可以通過(guò) plt.imshow(self.wc.recolor(color_func=img_color))使圖片顏色跟字體顏色一樣    plt.axis("off")    plt.show()if __name__=='__main__':  mywc = wc('sanwen.txt','out.png','font.ttc')  mywc.show_wc()


使用wc.recolor(color_func=img_color)

發(fā)表評(píng)論 共有條評(píng)論
用戶(hù)名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 永清县| 垣曲县| 余江县| 昌图县| 沐川县| 林甸县| 革吉县| 北川| 融水| 宝山区| 阿克| 田林县| 肇源县| 泸水县| 淮南市| 达尔| 曲麻莱县| 沙河市| 扶余县| 高安市| 南雄市| 驻马店市| 潜江市| 沁水县| 河北省| 襄汾县| 新巴尔虎左旗| 栾城县| 凤城市| 邯郸县| 沁阳市| 绥芬河市| 九寨沟县| 永清县| 乌兰察布市| 临泉县| 志丹县| 萨嘎县| 石柱| 阿合奇县| 南安市|