俗话说:不要只顾低头拉车,还要抬头看路。意思就是在努力的同时,也要经常看看方向,不断明确目标。咱们学习Python也一样,既要认真的学,又要经常看看学了有什么用。这就是咱们这个系列的特点,通过职场中的实际问题,来沉浸式的学习Python。说实话,这也是Python的一大优势,边学边解决问题。她就像一个软件工具,几行代码就能解决一个实际职场中的问题,比如我们第三节介绍的,仅仅用三行代码就解决了一个经常遇到的问题。这和使用一些软件工具,如excel,剪影,美图秀秀没太大的区别。这些工具你也要简单的学习它的基本操作,只不过他们是用图形方式展示的,Python是用程序语句展示的。
1、什么是词云
今天,我们继续介绍怎么用Python解决职场中的实际问题。对了,就是怎么定制自己的词云。什么是词云呢?“词云”由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于2006年最先使用。 “词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。词云”就是数据可视化的一种形式。给出一段文本的关键词,根据关键词的出现频率而生成的一幅图像,人们只要扫一眼就能够明白文章主旨。如下图:
有人说,工作做得好的,不如PPT做得好。这不是让大家投机取巧,而是让大家学会更好的展示自己的工作成果。词云,就是一种可视化手段,在很多场合可以使你的工作成果得到更好的展示,更有冲击力,说服力。比如,对材料的总结分析;比如年终工作总结在PPT上展示一下这一年来的工作内容词云等等。你想要感受一下词云的效果,可以在百度搜素词云图片,真是外采缤纷,创意十足。
今天,我们就用Python制作属于自己的词云,非常简单。别忘了,玩Python就是做一个无所不能的调包侠而已。
2、安装第三方库
要做调包侠,当然需要安装第三方库了。本文介绍的方法,需要安装三个第三方库,他们是:
wordcloud、jieba、matplotlib
- 第一个库,看名字就知道是生成词云的;
- 第二个库,对拼音“结巴”,是对中文文章进行词语分割的,即:分词。名字起得很形象吧;
- 第三个库,是进行可视化展示的,即生成图片什么的。
还记得怎么用Thonny安装第三方库吗?忘了的话复习一下第三节。
一定要把三个库都安装上,再进行下面的实操学习。
3、撸代码,生成定制的词云
先把代码秀出来,通过前面的学习,今天我们可以进行简单的代码分析了。这说明,你不但知其然,而且知其所以然,越来越专业了。
有效代码正好十行,为了清晰,便于讲解,大致分为四个部分。
- 1-3行:引入我们的第三方库,这里有几种形式,你现在照着输入即可;
- 6-9行:这个是上一节讲的,你能说明吗?对,三个引号的字符串,也就是你要做词云的文字。这里,我们用的是刘禹锡的《陋室铭》;
- 11行:用jieba对文字进行分词处理;
- 12行:这个也是上节讲的字符串操作方法。用空格将分词后的词语连接成一个字符串;
- 13行:指定词云所用的字体,这里是仿宋体;
- 14行:生成词云;
- 16-18行:把生成的词云展示出来。
效果就是下面这样的。
你的结果,可能和我不一样。这是正常的,因为颜色,位置都是随机的。但是文字大小应该是一样的。
今天的这个案例很实用,你可以把文字换成你自己的内容,就可以定制属于自己的词云了。这里,我们仅仅是讲了最基本的词云生成方法,其实正如你百度搜索的那样,词云还可以有各种各样的变化。比如,背景啊,颜色啊,字体啊,轮廓啊等等。这都可以通过完善第13行代码,来实现。希望你能探索一下,举一反三,制作出更漂亮的,有特色的词云来。