作为智能录音笔,语音转写功能和降噪自然是很多用户关心的,接下来我们看一下讯飞SR701和搜狗S1在语音转写和智能降噪上的表现。
2、标准朗读场景
首先我们来看一下第一段音频文件,原录音采自《新闻联播》4月5日《为了民族复兴英雄烈士谱系列报道》栏目。以下转写内容均在采访模式下进行,搜狗S1转写内容如下:
▲搜狗S1转写
搜狗S1文字转写功能需要登录搜狗语音助手专门的网页,然后从网页下载才能编辑转写的内容,搜狗S1的一个好处是,它可以智能识别录音文件中不同讲话人的声音,最多可以区分四个人,识别录音中的掌声、笑声以及语气词,这些接下来的例子中会有所提现。通过这段《新闻联播》内容的转写我们看到,搜狗S1在个别的人名、断句上有所欠缺。另外发音相近的一些词语也会被误识别,比如转写的内容中,“事迹”一词就被误转成“世界”,“新医药”被误转称“星医药”。
在来看讯飞SR701的转写表现,讯飞SR701在这篇报道中识别准确率基本上达到了100%,特别是在文字的断句上,表现比搜狗S1好很多,尽管“办利群书社”、“太阳能光伏”、“新能源汽车”在停顿上存在一些小瑕疵,但这并不影响整体的阅读。
▲讯飞SR701转写
3、发布会速记
接下来我们再来看看,转写抗疫指挥部新闻发布会的一部分讲话内容。首先我们来看一下搜狗S1的表现,在未开启智能辅助矫正功能情况下,我们看到搜狗S1转写过程中也将诸如“呃”、“哈”等语气词记录下来,如果开启智能辅助矫正,诸如语气词、重复词、停顿词等内容就会自动被过滤。
▲搜狗S1未开启智能辅助矫正