阅读文章前辛苦您点下“关注”,方便讨论和分享,为了回馈您的支持,我将每日更新优质内容。
Mohammad等人使用78个正负向情感词作为种子词汇,从775000条Tweets中抽取情感词汇。
情感得分如果一条Tweet包含正向种子词汇,则这条Tweets判定为正向情感,如果一条Tweet包含负向种子词汇,则这条Tweets判定为负向情感。
它们对每个词汇计算正向点互信息(PMI)与负向PMI的差值得分,如果得分为正数,则表明这个词汇为正向情感词汇,如果得分为负数,则表明这个词汇为负向情感词汇。
得分的绝对值越大,表明该词汇的情感强度越强。他们用这种方式构造了新的情感词典,以补充现有的情感词典。