编者按:快手平台上视频类型繁多,且视频源的画面质量存在较大差异。“面对种类多且质量差异较大的视频,如何让用户获得更清晰的观看体验?”对于这一问题,快手音视频技术团队深入研究智能音视频修复及增强处理等相关技术,打造“快手质臻影音”,为用户提供极致视频体验。本次LiveVideoStackCon 2022上海站大会,我们邀请到了快手音视频高级算法工程师何刚老师,为我们分享了快手平台视频多样性和处理挑战;针对这些挑战提出的智能修复和增强算法;以及质臻影音的落地方案。
文/何刚
整理/LiveVideoStack
大家好,我是何刚,距离我上次参加LiveVideoStack2019年分享视频增强算法已过去三年之久,这三年发生了很多故事,也对所处领域带来了很多机遇与挑战。对我来说最让我荣幸和开心的是加入快手音视频算法团队,并和团队一起完成很多有意义的工作。这次主要就来分享下我们团队在视频增强修复方面做了哪些工作。
分享主题为《快手质臻影音:视频智能修复及增强技术》,内容包含以下三个方面:第一是介绍快手平台视频多样性和处理挑战;第二是针对处理挑战,我们提出的智能修复和增强算法;第三是团队如何用增强算法解决挑战并构成体系,即质臻影音的成功落地方案。
1、快手平台视频多样性和处理挑战
1.1 快手视频内容多样性及处理挑战快手应用平均日活跃用户达3.47亿,每天新视频上传量在千万量级。针对如此大规模的视频数量进行增强修复和画质提升,主要有如下两个方面的挑战。
第一是视频内容的多样性,包含类型繁多,如:新闻、生活、娱乐、游戏等。多样化内容表示什么样的内容都可能出现,也就意味着算法处理需要针对多种类型视频内容。
第二是视频质量的参差不齐,千万量级的视频中,有些制作精良,但也有很多素材制作不佳。首先,针对UGC来说,用户的手机机型存在差异,且在视频制作的过程中,用户有时会加入一些非拍摄素材,制作技术也非专业级别,这些因素都会导致视频存在噪声、模糊、低分辨率、低帧率等问题。其次,即使PGC作品也会存在一些问题,如在视频二次创作过程中,制作水平的差异化造成视频质量参差不齐,并且对于老旧影片还存在划痕、严重胶片噪声等损伤。此外,视频还会经历多次转码压缩损伤,用户在拍摄时就会有第一次编码,之后如果用户再进行多次编辑,这就意味着多次损伤,当用户把视频上传时,平台也需要做转码工作——这样一个叠加操作过程下来,视频会经历多次转码压缩损伤。
面对这些挑战,如果用人眼或手动去判断视频质量并尝试做相应增强处理,这显然是不现实的。为此团队建立了智能的增强处理技术架构。此外,我们还要平衡成本和效果,考量如何获得高ROI。
如下是快手平台容易出现低画面质量视频的类型案例:包括高噪声低质量视频(夜间拍摄或光线不足等导致)、模糊低质量视频(拍摄失焦、设备原因或运动过快等因素)、块效应低质量视频(非专业多次编辑或多次转发等因素)等。
1.2 智能修复及增强算法:总框架