词云(wordcloud)作为一种可视化方法,通过形成“关键词云层”或“关键词渲染”,对文本中出现频率较高的“关键词”赋予视觉上的突出。词云图可以过滤掉大量不重要的文本信息,使浏览者只要一眼扫过文本便可知晓文本的主旨,现在已经广泛运用在企业、教育、文化等领域中。
第三方库的安装与简介用Python制作词云图需要用到的第三方库有如下:
- jieba(分词)
- wordcloud(生成词云)
- matplotlib(图像处理)
- PIL(可选)
- numpy(可选)
示例一:制作简单词云安装方法:
pip install jieba / pip3 install jieba
pip install wordcloud / pip3 install wordcloud
下面,我们开始编写一个程序用于生成《新冠病毒无症状感染者管理规范》的词云图。
首先,导入程序所需第三方库,如下:
导入第三方库
其次,根据功能划分主要有以下四部分:
(1) 读入制作词云的txt文本素材
读入txt文本数据
(2) 对文本素材进行分词操作
分词操作
(3) 设置属性并生成词云