WordCloud库是python的一个第三方库,主要以词语为基本单位,进行词云的展示,词频越大,在显示出来的词云中词语就越大。本文主要记录如何去使用WordCloud读取文件生成词云。
实验环境:Win10 PyCharm Anaconda3
语言:Python
程序输入:csv/txt文件名
程序输出:词云图
首先要安装wordcloud库,以前一直用的是“pip install 库名”,有时候在安装很多库的时候会出现下载很慢的情况,最后自己查资料摸索出了使用国内镜像去安装第三方库的方法,发现很实用。以安装wordcloud为例,在DOS中输入以下代码即可,以后要安装其他第三方库,只需要更改库名就可以:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple wordcloud
一、wordcloud的基本使用
安装好第三方库之后,就可以使用了。wordcloud库把词云当作一个WordCloud对象。所以首先要想使用wordcloud,分为三步:
- 创建对象
- 加载文本(使用generate()方法,括号里面是文本参数)
- 输出文件(使用to_file()方法,括号里面是文件名称)
以下为一个基本的例子(暂不考虑中文):
- 创建对象:wc= wordcloud.WordCloud()
- 加载文本:wc.generate("Choose a life of action, not one of ostentation.")
- 输出文件:wc.to_file("./picture/1.png")
通过以上三行代码,一个基本的词云就生成了,如下图所示。
看起来还不错,哈哈哈,那就再试试中文,同样的代码,将generate方法中的语句换成汉字“今天是个好日子”,生成的词云如下图所示。
出现这种情况,是因为没有设置字体,个人觉得这开发语言是老外发明的,他无法理解我大天朝的文化,那怎么去解决呢?只需要去加入字体的参数就可以。这里主要记录以下各个参数的用途,如下图所示:(图片来源于网络)
按照上面的参数,先设置一下字体就可以显示出来了。下图为代码和生成的词云。