国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python生成詞云的實(shí)現(xiàn)方法(推薦)

2020-02-16 01:42:04
字體:
供稿:網(wǎng)友

期末復(fù)習(xí)比較忙過段時(shí)間來專門寫scrapy框架使用,今天介紹如何用python生成詞云,雖然網(wǎng)上有很多詞云生成工具,不過自己用python來寫是不是更有成就感。

今天要生成的是勵(lì)志歌曲的詞云,百度文庫里面找了20來首,如《倔強(qiáng)》,海闊天空是,什么的大家熟悉的。

所要用到的python庫有 jieba(一個(gè)中文分詞庫)、wordcould 、matplotlib、PIL、numpy。

首先我們要做的是讀取歌詞。我將歌詞存在了文件目錄下勵(lì)志歌曲文本中。

現(xiàn)在來讀取他

#encoding=gbklyric= ''f=open('./勵(lì)志歌曲歌詞.txt','r')for i in f:  lyric+=f.read()

加入#encoding=gbk是為了防止后面操作報(bào)錯(cuò)SyntaxError: Non-UTF-8 code starting with '/xc0'

然后我們用jieba分詞來對(duì)歌曲做分詞提取出詞頻高的詞

import jieba.analyseresult=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result:  keywords[i[0]]=i[1]print(keywords)

得到結(jié)果:

然后我們就可以通過wrodcloud等庫來生成詞云了

首先先自己找一張圖片來作為生成詞云的形狀的圖

from PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorimage= Image.open('./tim.jpg')graph = np.array(image)wc = WordCloud(font_path='./fonts/simhei.ttf',background_color='White',max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis("off")plt.show()

保存生成圖片

 wc.to_file('dream.png')

完整代碼:

#encoding=gbkimport jieba.analysefrom PIL import Image,ImageSequenceimport numpy as npimport matplotlib.pyplot as pltfrom wordcloud import WordCloud,ImageColorGeneratorlyric= ''f=open('./勵(lì)志歌曲歌詞.txt','r')for i in f:  lyric+=f.read()result=jieba.analyse.textrank(lyric,topK=50,withWeight=True)keywords = dict()for i in result:  keywords[i[0]]=i[1]print(keywords)image= Image.open('./tim.jpg')graph = np.array(image)wc = WordCloud(font_path='./fonts/simhei.ttf',background_color='White',max_words=50,mask=graph)wc.generate_from_frequencies(keywords)image_color = ImageColorGenerator(graph)plt.imshow(wc)plt.imshow(wc.recolor(color_func=image_color))plt.axis("off")plt.show()wc.to_file('dream.png')

以上這篇python生成詞云的實(shí)現(xiàn)方法(推薦)就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持武林站長站。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 岳池县| 务川| 南京市| 敖汉旗| 洱源县| 乐亭县| 衡东县| 怀仁县| 普陀区| 葵青区| 平定县| 藁城市| 香港 | 顺昌县| 邮箱| 嘉峪关市| 岐山县| 安岳县| 阿城市| 桃园市| 枣庄市| 田林县| 合阳县| 绥棱县| 区。| 绥德县| 宝鸡市| 民勤县| 额尔古纳市| 大港区| 上蔡县| 昌平区| 和田市| 册亨县| 琼海市| 宁河县| 石城县| 曲水县| 全南县| 周口市| 龙游县|