一、前言:60秒长语音有希望消灭了
从2010年,讯飞推出业界首个中文语音输入法,将语音输入带到大众面前直到今天,语音输入早就不再是当初功能机时代“语音王”的土味儿模样。如今,语音输入已经逐渐超过手写,成为在手机端一种不可或缺的日常输入方式。
但是,语音输入痛点也有很多,比如口音、方言、多人说话、噪声、吞音、远场语音等,具体到日常场景当中表现为:中英文混杂语音输入识别不佳、在安静场所难以使用、噪声环境的输入效果容易受到影响、同音字词的识别效果不佳。
这样一来,随着输入量的增加,很多语音输入工具的表现常常令人抓狂,促使越来越多的人在QQ/微信你来我往一段又一段令人崩溃的60秒长语音。
日前,讯飞输入法的Android版和iOS版均更新了AI语音引擎,进一步优化通用语音识别效果,同时还基于说话人和使用场景,重点提升语音候选词、噪声环境、轻声说话及专有名词的识别准确率,使讯飞输入法通用语音识别准确率在98%的基础上进一步提升。
先来看看讯飞输入法更新日志:
Android V9.1.9671
1、升级A.I.语音引擎,提升语音候选词、噪声环境、轻声说话及专有名词的识别效果
2、优化离线语音使用体验,无网、弱网环境语音输入依然出色
3、无障碍模式适配新增手势操作,双指滑动切换候选并支持阅读
4、拓展表情发送功能,适配QQ国际版和QQ极速版
iOS V9.1.2930
1、升级A.I.语音引擎,提升语音候选词、噪声环境、轻声说话及专有名词的识别效果;
2、优化离线语音使用体验,无网、弱网环境语音输入依然出色
3、减少键盘闪退现象,提升输入稳定性
看更新日志说得这么美好,实际效果如何呢?正好手里的华为P40 Pro所载讯飞输入法升级到了最新版,笔者也已经使用了一段时间,接下来就是我们的评测体验。
二、可能是市面上免切换语音输入效果最好的输入法
此前,讯飞输入法大数据显示,约80%的方言母语者同时使用普通话,在私密场合或者面对方言交流对象时,习惯使用方言,表达更亲切;在正式的社交或工作场合,使用普通话避免沟通障碍。
这便催生了免切换模式的出现。其实早在9.0版本的时候,讯飞输入法就内置了“普通话粤语免切换”模式,实现普通话、粤语语音输入免切换,在普通话保持高精准识别的同时,粤语识别率高达95%,并通过语音输入来高效打出粤语正字。
Android V9.1.9671和iOS V9.1.2930最新版本的讯飞输入法保留并进一步优化了“不用切换”的语音输入,在默认中文“普通话(随心说)”识别模式下,已经实现了英文语音、中英夹杂、英文 中文以及带口音的普通话等不同场景的免切换识别支持。
——全英文语音输入
在默认中文“普通话(随心说)”识别模式下,我们直接开飙英文。
我们使用TED演讲音频,录入一段相当长的英文语料,被讯飞输入法准确识别并加以合适的排版、断句。
——中英夹杂语音输入
一般来说,输入法的语音识别只能同时识别一种语言。如果在普通话当中突然插入一个“hello、byebye”之外的并不太常见的英文单词,很多输入法可能就反应不过来,直接识别失败了。也就是难以处理中英混输,尽管或许能识别出了夹杂在中文里的英语词汇,但却会在整句语义判断上产生干扰,最后导致句子不通顺。
不同语言的混输绝对算是语音输入技术的一大难点。
然而语言混用的现象我们又很难绕开,比如“DNA序列测定”、“开启MTP”、“AMOLED材质的屏幕和IPS的材质屏幕哪个更好”,如果用中文强行表达,变成了“脱氧核糖核酸序列测定”、“开启多媒体文件传输协议”、“有源矩阵有机发光二极体显示屏和平面转换液晶面板显示屏幕哪个更好”,会让人感觉十分别扭和陌生。
通常情况下,用键盘输入中英文混合的内容,需要选词甚至切换语言,而最新版的讯飞输入法支持中英文语音混合输入,而且免切换的,无需多余的设置,在默认中文“普通话(随心说)”识别模式下就可以体验。
比如直接说出“在一个阳光普照的moment,我欣喜若狂地拿到了大公司offer”,讯飞输入法精确识别出了中英文词汇,并理顺句子,所转换出来的文字非常通畅。
在体验的过程当中,其混合输入的速度和准确率也都非常高,几乎和单一普通话的识别效果没有明显差距,解决了语言混合输入效率低下的一大痛点。
——完整中文 完整英文语音输入
在默认中文“普通话(随心说)”识别模式下,我们尝试使用完整中文 完整英文音频,看看讯飞输入法的识别效果如何。