智东西(公众号:zhidxcom)
编译 | 屈望苗
编辑 | 江心白
智东西4月10日消息,据外媒Tech Xplore报道,近日苹果称正在研究如何让语音助手Siri感知用户的音调、音量和环境声音。这种感知功能可以帮助Siri决定如何对用户的语音指令做出回应,比如大声还是小声回答。
据报道,这个新功能将在iOS 14.5及更高版本中使用。
一、改善Siri不会随环境改变音量的问题
2010年,Siri被苹果以2亿美元收购,随后逐渐拓展了丰富的语音交互功能,并广泛搭载于iPhone、iPad、HomePod、Apple Watch等苹果硬件产品中。
但不少用户曾指出,Siri的功能还不够多样。例如无论何时何地,Siri回应语音指令的音量大小都是一样的,哪怕在一个轻声细语的场景下亦是如此,这时常会给一些用户带来困扰。
目前在业内,亚马逊的语音助手Alexa已经能够识别用户发出语音指令的环境,并在用户轻声发出指令时做出相应的轻声回复了,而Siri还没有这样的功能,因此,苹果公司计划为Siri研发识别用户语音命令的音调变化和音量,来调整回复的音量。
二、新功能可以根据场景智能切换音量、音调
在苹果4月1日发布的《Blow Event》新专利申请中,苹果表示希望提升Siri的性能,使其能够检测外界的声音变化,如果用户大声发布指令,Siri就会认为用户处在嘈杂的环境,然后大声回复;相反,则会小声回复。这项新功能让Siri无论环境如何,都能发出与用户指令音调和音量相匹配的回复。
理想情况下,这项新功能将实现以下场景:如果用户在晚上向Siri低声发出指令,就会收到小声的回应;而如果在一个嘈杂的空间对Siri发出指令,Siri仍然能够识别到,虽然它回应可能会变慢,但声音会变大。
此外,苹果还打算通过这次升级,让Siri能够识别设备的位置、与用户的距离以及所处房间的噪音水平,还会考虑到预先设置的音量和当时时间等其他因素。通过这次更新,苹果的Siri将能够识别环境噪音的细微差别,也能更好地与其他的人工智能语音助手竞争。
三、iOS 14.5版本及以上将有两种新的英语Siri语音
据报道,Siri的声音是使用不同配音员的声音合成的,由神经元文本转语音引擎(Neural Text to Speech Engine)将处理器的文本命令翻译成可听的语音。iOS 14.5版本及以上的用户将可以使用带有两种更接近人类语言模式的英语Siri语音。
目前,苹果用户可以用HomePod继续接收Siri升级的更新,只需说:“嘿,Siri,打开AppleInsider(苹果科技博客网站)。”还可以说“嘿,Siri,打开HomeKit Insider(苹果的智能家居平台)”来了解智能家居的最新消息。
结语:语音助手优化继续推进
这次Siri的更新是苹果在语音助手功能多样性上做出的一次尝试,让Siri更加场景化和人性化,优化了苹果用户的使用体验。语音助手的智能化还在继续推进,在iOS 14.5最新测试版的发布中,苹果还取消了Siri默认的女性声音,让用户可以自行设置。
正如苹果在声明中表示的,“我们很高兴为英语用户推出两种新的Siri声音,并让Siri用户在设备初始化时可选择他们想要的声音。这是苹果长期以来对多元化和包容性承诺的延续,我们的产品和服务旨在更好地反映我们所处世界的多样性。”
来源:Tech Xplore