来源:Python爬虫与数据挖掘
作者:黄伟
前言大家好,我是黄伟。词云,相信大家对这个概念比较陌生,它其实就是指的是对某一段文本中出现频率最高的关键词进行特殊描绘,过滤到太多没用的字眼,以此达到视觉上的突出,让人一看就知道这篇文章讲的什么。
一、词云的运用设计到的模块:wordcloud
编辑器:sublime text 3
编译器:Python 3.6
1.下载安装wordcloud模块
pip install wordcloud
2.导入模块并初始化词云对象
下面我们打开它的帮助文档看看它的使用方法:
可以看到这个类就是词云初始化的主要类,下面都是它的初始化参数,所以我们要使用它:
import wordcloud
wc=wordcloud.WordCloud(font_path=r'C:\Windows\Fonts\华康少女文字简W5.ttc',width=200,height=100) #初始化
这里为了使得生成的词云图更好看,所以我加入了华康少女字体,这个字体不是系统自带的,得下载。下载好后把它放到window 字体文件夹中。
3.加入文本到词云中
使用初始化的对象来调用文本生成器,我们从帮助函数中可以得出它有两个生成器函数。
这两个生成器函数差不多,而且意思相近,这里不做过多讨论,我们来看下它的使用方法:
wc.generate('任性的90后boy')
这样就从文本中生成词云了。
4.显示词云对象
生成之后,我们需要把它显示出来,那怎么办呢?如图所示:
由此可以看出它有四种生成方式,即为:数组,文件,html,图片。我们随机选择一种,就选文件。
wg.to_file('gf.jpg')