当前阶段,标准场景下的人脸识别已经能够实现非常成熟的应用,但在一些非标场景,人脸的应用效果仍有待提升。由于人脸信息相对单一且容易受到外界环境干扰影响识别结果,因此,近年来,对于跨摄像头、跨空间的目标人物检索,行人重识别技术Re-ID正作为新兴研究方向受到越来越多的关注。
行人重识别(Person Re-Identification,简称 Re-ID)也称为跨镜追踪技术,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,指通过穿着、体态、发型等在不确定的场景中能够再次识别是同一个人,并以此描绘出个体行进轨迹的AI视觉技术,简而言之,就是通过计算机视觉技术检索不同摄像头下的同一个目标人物。
Re-ID不同于人脸识别,人脸识别是用来认证一个人的身份,而Re-ID是将同一个人在不同摄像设备下的影像匹配起来,生成跨摄像头时空轨迹。典型的基于行人ReID的应用是以图搜图。如下图所示,最左边无边框图片为检索图,右边有边框的图片则是按相似度由高到低排序的结果。
(图片来源:高重科技)
这几年来随着行人重识别技术在公安、交通、零售等行业领域的需求的日趋广泛,不少厂商也陆续发布了在相关数据集测试的结果以此来彰显企业在Re-ID技术研究方面的成果。其中Market 1501、DukeMTMC-reID、CUHK03这三个衡量Re-ID技术的数据集测试也是业内最常用的行人重识别权威数据集测试。在Re-ID技术研究领域,首位命中率(Rank-1Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量算法水平的核心指标。
安防知识网编辑梳理了近两年来国内部分企业在三大公开数据集的测试结果,如下图所示,在算法技术不断迭代之下,以Market 1501数据集为例,首位命中率和平均精度均值都陆续超越了97%、94%的水平值,推动着行人重识别算法水平迎来新的突破。
近两年国内部分企业在三大公开数据集上的测试结果 图:安防知识网 资料来源:厂商资料
而除了智能安防和人工智能领域的部分企业之外,阿里和腾讯优图的刷榜也让业界更多的注意到了Re-ID这项技术,为后续这项技术的商用化落地铺垫了前期基础。
行人重识别Re-ID技术研究几大现实难点:
现阶段,Re-ID的技术研究仍然面临着很多现实问题和技术难点,这些问题主要包括数据获取难度大、算法训练难度高以及一些实用角度的投入产出比问题。
数据获取难度大:相比于人脸数据,Re-ID中行人数据严重稀缺,行人最主流的数据集(Market1501)才1000-3000个行人ID,而人脸的公开数据集ID规模已超100万,企业私有的ID规模可能更大。造成这一现象的主要原因是由于行人数据集需要采集自同一个人在一段时间内同时出现在多个摄像头下,这样严苛条件限制了行人数据集的构建。正因为数据的缺失,对跨镜追踪技术的算法研究提出了更高的要求。
算法训练难度高:数据的稀缺本身就是一个大问题,在这个基础之上,现有的视频监控由于受成像质量、分辨率等因素的制约,还会导致抓取的图像信息模糊不清。当然还有相机拍摄角度差异大、室内室外环境变化、行人服装配饰更换、季节性穿衣风格差别大、白天晚上光线差异等等因素的影响,让跨摄像头、跨地区、跨时间的Re-ID分析变得更加困难,要解决的实际问题非常复杂。除此之外,在很多安防系统中,视频监控探头的码流带宽以及摄像头部署的密度也都会限制Re-ID算法准确度的提升。
同时,用户对于投入产出比的顾虑也比较大。要在产品上应用、在项目中落地、只提高几个百分点的准确度,而计算量和内存开销、存储开销严重增加,客户肯定不愿意买单。在准确度不完美的情况下,把技术应用到产品上,就要花很多功夫做应用创新,比如计算速度和内存开销。
针对上述提到的数据采集和算法训练的相关问题,目前业内部分企业已经相继推出了一些技术突破手段:
阿里:通过局部信息的挖掘,专注于解决行人在识别过程中表观姿态变化剧烈,不容易对齐的问题。一方面,通过人体得到具有强语义信息的部件,并利用在其中寻找最具有区分性的区域。另一方面,使用了基于金字塔的水平分块策略,得到行人固定区域的可辨识信息。在训练中,同时采用两种策略相结合的方式,达到行人图片的对齐,从而实现更精准的匹配识别。
中兴通讯:创新性地提出多模块多粒度联合的特征提取网络,有效的解决了因摄像机拍摄角度、色差、光照强度等引起的侧脸、遮挡及缺失等复杂情况,显著提升了网络特征匹配性能。
澎思科技: 用全局特征来度量每一帧图片的权重往往会损失掉许多重要的信息。采用分割*策略将特定局部特征*成多个视频序列进行学习,进而极大减少局部特征损失对最终特征的影响;其次,提出了全新的双向图注意力机制模块。将图卷积神经网络和SENet完美结合,在整个序列上进行通道域的模式选择学习。同时通过双向网络进行空间域的注意力区域学习。由于图卷积网络的特性,每一帧图片的注意力特征都是与其他帧相互学习结合的结果,从而极大提高特征的代表性;最终,利用帧间相似度进行序列融合,这样,数据的类内相似度得到了极大的提高。在结合三元损失函数进行训练后,类间相似度得到了降低,进而提高重识别效果。
大华股份:应用图像数据增强方法,其主要包括随机模糊和随机截补等策略,能够有效地模拟各种环境下的人体遮挡、模糊和不完整等复杂情况;其次,针对多分支部件网络中特征粒度差异问题,采用一种递进式部件网络模型PPM(Progressive Part Model),各分支之间除了共享的基础卷积网络部分,还存在一种级联的语义关系;最后,在设计的PPM网络中,通过重叠采样操作促进各部件分支提取更显著的特征信息,应用改进的损失函数学习出基于球面约束的特征嵌入空间。
千视通:基于多年实战经验,提出一种卡视联动技战法,结合人脸识别和跨镜追踪(Re-ID)各自的特点及优势,以少量的人脸卡口加大量的普通监控探头的部署,既可锁定嫌疑人身份,又能重现嫌疑人轨迹,这种创新的综合型技战法可以较大概率对监控范围进行覆盖,具有极强的实战价值。
奇点云:重点攻克行人重识别算法的两项核心技术:基于分块的随机丢弃利用率较低的子空间特征增强attention机制,多种loss融合提高精确度,使得原先Re-ID93%的准确率得到提升。
腾讯优图:多任务框架的交替训练、基于分块的金字塔模型。通过这两项核心技术的成功应用,腾讯优图在三个主流数据库上都获得了相对原始基线模型至少6.34%的指标提升。
云从科技:全局特征跟多粒度局部特征结合,既抓大一统特征,也抓细节,如衣服LOGO 、背包挂饰等,增加检索识别的特征元素,提升准确性。
可以说,Re-ID行人重识别技术将人工智能的认知水平从“识脸”提升到了“识人”的新阶段,在跨空间、时间、地域的人物目标检索应用场景之下,可以发挥比人脸识别更重要的作用。
比如,走失人员寻回、嫌犯追踪等典型的AI寻人的应用。另一个比较典型的应用场景在于商超场所的客流热力图统计,通过实时动态跟踪用户轨迹(隐私保护前提之下)来助力商场完善店铺陈列和购物体验。而随着相关技术的日趋成熟,相信未来Re-ID技术将改善更多场景下传统的“找人"”寻物“模式,带来作业效率的显著提升。