IT之家 9 月 3 日消息,今日晚间,小米创办人、董事长兼 CEO 雷军通过社交媒体表示,小米工程师研发了一套表格识别算法,该算法高效准确地将图片中的表格转化为可编辑的 Excel 文件,大幅提升使用体验。
同时,小米技术官方也发文对表格识别算法中的一些技术实现原理进行了解读,涉及总体框架、表格检测算法、表格识别算法、对齐算法等内容。
以下为小米技术官方解读内容:
表格识别是指将图片中的表格结构和文字信息识别成计算机可以理解的数据格式,在办公、商务、教育等场景中有着广泛的实用价值,也一直是文档分析研究中的热点问题。围绕这个问题,我们研发了一套表格识别算法,该算法高效准确地提取图片中的表格,转化为可编辑的 Excel 文件。目前算法已经成功落地于小米 10S 系列、MIX Fold 2 等旗舰机型,大家可以从相册-更多-表格识别,或者扫一扫进入体验。
▲ 图一雷军在 MIX Fold 2 发布会上介绍小米表格识别算法
一、背景
大多数人日常办公处理的文件,主要是表格和文档,其中表格的重要性毋庸置疑。在各行各业的桌面办公场景中,Excel 和 WPS 是电子表格的事实标准。我们经常遇到这种需求:将一个表格图片的内容导入 Excel。
以前我们只能对着图片一点点把内容录入 Excel,既低效又容易出错。近年来,随着技术的发展,OCR(光学字符识别)的可用性不断提升,用户可以借助 OCR 软件,从图片中自动提取文本信息。
然而对于表格场景,仅提取文字是不够的,用户还需反复手动复制粘贴以还原出电子表格,这仍会耗费大量时间。为此我们实现了一套表格图像提取方案,它能切实提升用户办公效率。图二是我们的识别效果展示:
▲ 图二表格识别效果展示
二、总体框架
图三展示的是我们目前算法的一个总体框架图,主要包含手机端的表格检测算法和服务端的表格识别算法。