怎样在微博发表自己的意见,怎么把自己的微博发到评论里

首页 > 实用技巧 > 作者:YD1662024-02-07 05:46:14

同时,他们用表情符号来标注微博情感,用同样的计算方式构造了另一个新的情感词典。在对Tweets进行情感分类时,他们采用了多种类别的特征:词汇ngrams特征、字符ngrams特征、大写字符个数、词性特征、主题词(hashtag)特征、根据情感词典获得的一条tweets中每个词汇的情感得分、标点符号特征、表情符号特征等。

怎样在微博发表自己的意见,怎么把自己的微博发到评论里(5)

他们使用SVM分类器对数据集进行正负向情感分类,其中在Tweets上的情感分类获得了0.690的F值,在SMS数据集上获得了0.685的F值,在两个数据集上均获得了Sem-Eval2013竞赛中第一的排名4。

情感词典

与类似,Kokciyan等人也采用了多种类型的特征集合对Tweets进行情感分类。他们采用了如下多种特征:是否包含表情符号、是否有hashtag、英语单词的字符串形状、微博的最后一个词汇、情感词、否定词、hashtag、词性、n-grams特征等。

在对Tweets进行情感分类时,由于负向数据较少,直接将Tweets进行分类导致了负向类别的分类效果较差。

怎样在微博发表自己的意见,怎么把自己的微博发到评论里(6)

因而他们是用了两个分类器对Tweets进行正向、负向和中性类别的分类。其中一个分类器为正向分类器,采用最大熵模型,另一个分类器为负向分类器,采用NaïveBayes模型。

根据这两个分类器的结果判定Tweets的情感倾向。最终他们的实验中,正负向类别的平均F值为0.635.

Jaggi等人的工作在的基础上进行了优化。与不同的是,他们采用了稀疏线性分类器,而非密集分类器。

怎样在微博发表自己的意见,怎么把自己的微博发到评论里(7)

同时他们丢弃了n-grams的特征,而采用词性n-grams特征,在词性n-grams特征中,最多有两个词汇是微博中原来的词汇,剩下的词汇都被它们的词性所取代。

此外,他们还添加了两个新的情感词典,包括正向、负向、中性情感词汇,而非传统的只包含正负向词汇的情感词典。

怎样在微博发表自己的意见,怎么把自己的微博发到评论里(8)

上一页1234下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.