国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python生成詞云的實現方法(推薦)

2019-11-25 16:06:10
字體:
來源:轉載
供稿:網友

期末復習比較忙過段時間來專門寫scrapy框架使用,今天介紹如何用python生成詞云,雖然網上有很多詞云生成工具,不過自己用python來寫是不是更有成就感。

今天要生成的是勵志歌曲的詞云,百度文庫里面找了20來首,如《倔強》,海闊天空是,什么的大家熟悉的。

所要用到的python庫有 jieba(一個中文分詞庫)、wordcould 、matplotlib、PIL、numpy。

首先我們要做的是讀取歌詞。我將歌詞存在了文件目錄下勵志歌曲文本中。

現在來讀取他

#encoding=gbklyric= ''f=open('./勵志歌曲歌詞.txt','r')for i in f:  lyric+=f.read()

加入#encoding=gbk是為了防止后面操作報錯SyntaxError: Non-UTF-8 code starting with '/xc0'

然后我們用jieba分詞來對歌曲做分詞提取出詞頻高的詞

import jieba.analyseresult=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result:  keywords[i[0]]=i[1]print(keywords)

得到結果:

然后我們就可以通過wrodcloud等庫來生成詞云了

首先先自己找一張圖片來作為生成詞云的形狀的圖

from PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorimage= Image.open('./tim.jpg')graph = np.array(image)wc = WordCloud(font_path='./fonts/simhei.ttf',background_color='White',max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis("off")plt.show()

保存生成圖片

 wc.to_file('dream.png')

完整代碼:

#encoding=gbkimport jieba.analysefrom PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorlyric= ''f=open('./勵志歌曲歌詞.txt','r')for i in f:  lyric+=f.read()result=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result:  keywords[i[0]]=i[1]print(keywords)image= Image.open('./tim.jpg')graph = np.array(image)wc = WordCloud(font_path='./fonts/simhei.ttf',background_color='White',max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis("off")plt.show()wc.to_file('dream.png')

以上這篇python生成詞云的實現方法(推薦)就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林網。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 荥阳市| 湘西| 孝昌县| 凌云县| 德令哈市| 清苑县| 克什克腾旗| 翁源县| 基隆市| 胶州市| 淮滨县| 大荔县| 墨竹工卡县| 天峨县| 类乌齐县| 甘孜县| 新津县| 长宁区| 布尔津县| 德令哈市| 南昌市| 连州市| 新河县| 伽师县| 长丰县| 苍溪县| 和林格尔县| 湖北省| 襄樊市| 长沙市| 洪雅县| 石屏县| 盐源县| 天全县| 乐清市| 五家渠市| 孝感市| 林芝县| 金山区| 石门县| 阿勒泰市|