除了支持普通话,讯飞输入法的语音输入还支持 23 种方言语音,解决老年人不会说普通话的问题。
除了这些基础的改造,讯飞输入法长辈模式还支持语音播报功能,点按输入面板上的小喇叭图标,就会有语音朗读长辈们输入的文字信息,帮忙眼神不好的老年人检查错误。
此外,全新的讯飞输入法还内置老年人常用的表情包,让长辈们在聊天时也能用表情传递情绪,同时输入法中还内置了祝福语功能,逢年过节,不用担心不会回复别人的祝福。
经过一段时间的使用体验,IT之家觉得讯飞输入法本次的适老化改造还是比较用心的,从交互到文字输入到一些辅助性的功能都有涉及,相信能对老年人使用输入法带来非常大的帮助。
这不禁让人好奇,这些改进升级的背后,讯飞是怎样考虑的,一些独特的功能升级又是如何产生的?IT之家带着这些问题专门与科大讯飞的产品经理聊了聊。
输入法适老化改造,有切切实实的需求IT之家首先比较好奇的是,在这次输入法适老化改造中,讯飞是怎么挖掘到老年人的痛点和需求的。
对此,讯飞表示,首先是因为在他们庞大的用户数量中,老年人是其中重要的组成部分。一开始打算做这个适老化的改造,也是因为收到了很用户的反馈建议,希望在语音输入和方言识别之外,有更多针对长辈使用习惯的功能和交互。
这些反馈建议,为讯飞输入法的产品团队提供了初始的需求信息。针对这些以前没有被重视的需求,讯飞方面做了大量的用户调研,深入分析了很多行业数据报告,同时结合自己身边长辈的亲身经历,发现存在打字难、上网难、被忽视等难题。
比如有的用户反馈说妈妈不识字,但上网诉求很强烈,经常刷抖音、火山小视频、朋友圈,希望能读懂别人发的啥;有的反馈父母拼音也不太好,也不会说普通话,有人觉得手机键盘太小打字不方便等等。
发现这一系列问题后,讯飞输入法就开始进行适老化模式研发,在研发过程中,讯飞没有局限于自身现有的老年用户,更深入社区、老年大学去做了大量的调研,收集他们的需求,新的功能也第一时间交给他们体验,根据他们的反馈不断更新和完善产品。
另外记者也体验了 Windows 版的讯飞输入法。虽然没有做专门的适老化改造,但最新版本默认放大了视觉元素,支持语音输入,手写输入,方言识别,在线翻译等功能,无广告、无弹窗,功能纯净,非常适合老年人。
同时,讯飞称未来针对老年人的需求,和手机输入法类似,PC 版还将针对视觉交互以及功能定制等方面进行适老化改造,增加语音播报针对老年人的定制化功能。
AI,适老化改造的强大武器作为知名的智能语音和人工智能公司,科大讯飞的一大竞争力就在于 AI。那么这次改造中,讯飞是如何将自身的 AI 技术优势融入到输入法适老化的方方面面的呢?
这可以说是IT之家向讯飞产品经理询问的重点。
首先,讯飞表示,针对不同群体的输入需求,讯飞输入法致力于用 AI 技术为其匹配相应的解决方案。
比如讯飞输入法的 23 种方言语音识别。科大讯飞基于其对 A.I. 技术及语言深度研究的积累和储备,采用 Multi-lingual 多语言建模,通过多方言数据共享方式训练,实现对多方言的支持。
同时,讯飞还借助 Global Phone 全球音素集,从声学层面的相似性统一各方言的音素定义,对方言 “语图谱”模型做进一步精进,更借助了 “中国方言库”的方言数据进行模型训练,从而有针对性地提升方言语种的识别能力。
此外讯飞输入法产品还提供藏语、维语、彝语民族语音输入和方言翻译功能,使语音输入惠及更多用户。
IT之家曾在《告别智障第一步:小米靠这个让小爱同学更聪明》一文中为大家简述过语音识别的基本原理,可以看到要想实现更精准、快速的语音识别,是一个复杂庞大的工程。
事实上,讯飞输入法在提升语音识别精准度方面也经过了长时间的努力,不断将最新的 AI 技术引入到产品中。下面小编列举了一些讯飞在 AI 语音识别方面的探索案例,大家可以了解一下。
首先是 2010 年,讯飞 AI 研究院就将 GMM-HMM - 隐马尔可夫模型应用到语音识别系统中,通过运用 WFST 解码器,提高复杂的语言模型,达到了 70% 识别率。