为了利用无标签数据,我们设计了半监督损失函数,Unknown Identity Rejection(UIR)Loss。人脸识别是open-set问题,将开放环境中的人物类别分为两类:有标签类 (S)和无标签类 (U),S∩U=∅。训练过程中,对于有标签类,每个样本特征需要逼近分类层对应类别的类心向量;对于无标签类,它不属于分类层的任何一个类,模型需要“拒绝”它们,即特征与每个分类层类心距离都足够远。如下图(a),W1和W2 表示两个分类层类心向量,圆点表示样本特征。图(b)中,加入无标签类Wu 后,为了 Wu距离W1和W2足够远,会使得有标签类别在特征空间上更稀疏,类间距离更大。
对于 CNN 分类模型,全连接分类层的输出经过 softmax 后得到p1,p2,……,pn,表示属于各个类别的概率值。然而无标签类别并不属于任何一类,理想情况下p1,p2,……,pn应该都足够小,可以通过设置阈值将其过滤,提升库外拒绝率。基于这个想法,问题可以转化成:
上式是多目标最小化问题,可以转化成:
因此得到UIR loss,即: