我们的工作[10]是基于生成模型的方法,发表在 AAAI 2018 上,这应该是第一篇使用GAN模型的跨光谱合成方法。我们构建了生成对抗异质人脸识别模型(AD-HFR),并使用了全局和局部的结构,除了对整个脸部进行生成外,还对眼睛部分进行了专门处理,并且包含了身份保持函数。
三、总结
本次报告主要介绍了人脸图像编辑涉及的基础理论和应用方法。由于时间关系,基础理论部分还有部分内容没有深入介绍;而在应用部分,今天主要讲了超分辨率等,但还有人脸生成等许多应用没有涉及。
事实上人脸图像编辑,是计算机视觉中一个长期的研究目标,当前仍有很多问题没有解决。例如,当前研究的人脸图像分辨率大多是 128×128,随着手机的发展,其分辨率将会越来越高,那么如何编辑更高分辨率的图像?同时,很多场景对精确度的需求也变得越来越高,比如在 3D 重建中,医疗领域希望人脸的深度信息精度能够从 0.1 厘米提升到 0.05 毫米,这样便可以精准估计面部运动和身份信息。另外,一些特殊应用场景会要求生成十几万人乃至几亿人的人脸数据。另一方面,人脸图像编辑也是机器学习的重要研究内容,它的理论学习方法、硬件和软件都需要更大的突破,才能得到符合人类视觉感知的结果。
感谢中心成员张堃博、宋凌霄、吴翔、李祎、胡坦浩、黄怀波、李志航、李佩佩、胡一博和宋林森等人对于本次报告给予的协助和支持。谢谢大家。
参考文献
[1] 复杂场景中多模态生物特征获取设备. 国家自然科学基金委重大仪器专项.
[2] 基于定序测量的物体识别理论和方法. 国家自然科学基金委重点项目.
[3] 基于非欧空间的视觉计算理论与方法. 国家自然科学基金委重点项目.
[4] 基于深度学习的人脸超分辨率技术合作项目, 华为公司.
[5] 多视角人脸图像合成技术合作项目, 华为公司.
[6] Xiang Wu, Ran He, Zhenan Sun, Tieniu Tan. A Light CNN for Deep Face Representation with Noisy Labels. IEEE Trans. Information Forensics and Security (2018).
[7] Shu Zhang, Ran He, Zhenan Sun, Tieniu Tan. DeMeshNet: Blind Face Inpainting for Deep MeshFace Verification. IEEE Trans. Information Forensics and Security 13(3): 637-647 (2018).
[8] Ran He, Wei-Shi Zheng, Tieniu Tan, Zhenan Sun. Half-Quadratic-Based Iterative Minimization for Robust Sparse Representation. IEEE Trans. Pattern Anal. Mach. Intell. 36(2): 261-275 (2014).
[9] Yibo Hu, Xiang Wu, Bing Yu, Ran He and Zhenan Sun. Pose-Guided Photorealistic Face Rotation. CVPR 2018.
[10] Lingxiao Song, Man Zhang, Xiang Wu, Ran He. Adversarial Discriminative Heterogeneous Face Recognition, AAAI 2018.
[11] Yi Li, Lingxiao Song, Xiang Wu, Ran He, Tieniu Tan. Anti-Makeup: Learning A Bi-Level Adversarial Network for Makeup-Invariant Face Verification, AAAI 2018.
[12] Peipei Li, Yibo Hu, Qi Li, Ran He, Zhenan Sun. Global and Local Consistent Age Generative Adversarial Networks. ICPR 2018.
[13] Huaibo Huang, Ran He, Zhenan Sun, Tieniu Tan. Wavelet-SRNet: A Wavelet-Based CNN for Multi-scale Face Super Resolution. ICCV 2017: 1698-1706.
[14] Lingxiao Song, Zhihe Lu, Ran He, Zhenan Sun, Tieniu Tan. Geometry Guided Adversarial Facial Expression Synthesis. CoRR abs/1712.03474 (2018).
[15] Rui Huang, Shu Zhang, Tianyu Li, Ran He. Beyond face rotation: Global and local perception gan for photorealistic and identity preserving frontal view synthesis. ICCV 2017.