审核的人力无法满足需求,因此我们需要借助NLP实现两个业务目标:①使用模型辅助审核,提高审核效率。②实现部分评论的自动审核。
上图右侧红框内是文本质量标签和模型给出的处理意见,其下面打码的部分是一些具体操作。
2. 质量模型
基于上述业务目标,我们构建了一个质量模型。我们把文本质量分为优质、良好、普通、劣质四类标签,主要以语言的优美流畅性,与歌曲的相关性,情感极性以及主题类别等作为考量因素。例如上图中的红色评论,首先它和歌曲名有一定的相关性,并且使用了对偶句式。它的语言是比较优美流畅的,因此,我们给它打上了优质的标签。相较之下,黄色的评论是批评周董唱功,我们就给它打上了劣质的标签。
结合质量标签以及评论状态,模型可以给出具体的操作建议,从而辅助或者替代人工审核。
3. 质量模型-V1
第一版质量模型比较简单,主要是用BERT模型进行编码,然后做四分类。我们之前提到的优质、良好标签,它的判定需要融入一些歌曲相关性的信息,因此我们使用了Sentence Pair这种方式去引入歌手歌曲等信息,来帮助模型提取相关性特征。此外,在数据增强层面,我们使用了EDA以及适配业务的一些数据增强方法,有不错的效果。
4. 质量模型-V2
① V2模型的业务目标
第一版模型的劣质标签召回率偏低,主要来源于两种类型的漏召回:
第一个是对抄袭评论的漏召回,比如“初听不识曲中意,再闻已是曲中人。”初看这句话可能会觉得写得还不错,对仗工整,语言优美。但实际上这条评论频繁地出现在各种歌曲下,所以我们把它认定为为抄袭评论,这种评论大量出现在头部评论中,会影响用户阅读体验,因此我们需要给它打上劣质的标签。
第二,质量粗分类模型只能识别一些情绪比较强烈的辱骂评论,针对歌手歌曲客观负面评价难以召回。因此,我们的第二版模型的目标主要是去提升这两类劣质评论的召回。
② 提升抄袭评论的召回