python如何安装词云,python中文词云图需要安装

首页 > 教育培训 > 作者:YD1662023-06-20 02:34:18

pip install jieba

python如何安装词云,python中文词云图需要安装(5)

python如何安装词云,python中文词云图需要安装(6)

jieba的分词模式

支持三种分词模式:

这里我就以昨日爬取微博鸿星尔克的评论为测试内容。

“网友:我差点以为你要*了!”鸿星尔克捐款5000w后被网友微博评论笑哭...

python如何安装词云,python中文词云图需要安装(7)

import pandas as pd
import jieba
from stylecloud import gen_stylecloud

# 读取文件
pd_data = pd.read_excel('鸿星尔克.xlsx')

# 读取内容
text = pd_data['发帖内容'].tolist()

# 切割分词
wordlist = jieba.lcut_for_search(''.join(text))
result = ' '.join(wordlist)

# 设置停用词
stop_words = ['你', '我', '的', '了', '们']
ciyun_words = ''

# 过滤后的词
for word in result:
if word not in stop_words:
ciyun_words = word

print(ciyun_words)

可以看到,我们成功去除了我们不需要的词 ‘你’ ‘了’、 ‘我’、'的' ,那么这到底是个什么*操作呢?

其实很简单,就是将这些需要摒弃的词添加到列表中,然后我们遍历需要分词的文本,然后进行读取判断

如果遍历的文本中的某一项存在于列表中,我们便弃用它,然后将其它不包含的文本添加到字符串,这样生成的字符串就是最终的结果了。

python如何安装词云,python中文词云图需要安装(8)

上一页12345下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.