小度智能音箱语义识别
在语音识别当中,有一个非常关键的环节,叫“语义识别”,所谓的“语义识别”是指系统在语音识别的时候,会关联上下文进行语音识别,而不是把用户的一句话当成是一个独立的断句。
例如当小编第一句说“介绍一下百度公司”,而第二句说“那他的创始人是谁呀?”,这其中的第二句就是考验产品的语义识别功能,若是没有语义识别,系统是无法判断第二句话中的“他的”到底是谁,只有在结合第一句“介绍一下百度公司”后,系统才能够准确判断用户第二句话中的“他的”是百度公司,而小度智能音箱这里也能够完成这项语义识别的测试。
同理,左边那张图中,小编连续问了四句,第一句:来首周杰伦的歌,第二句:换一首吧,第三句:我不想听这个系列了,第四句:来点日本的吧。这四句话关联起来,其实就是一直在切换歌曲,除了第一句,每句话都有上下文关联。第四句中“来点日本的吧”这里指里的完整意思是“来点日本的歌曲”,最终小度智能音箱将音乐切换了另外一个日本音乐专辑,测试结果依然是成功的。
容错率和反应速度是判断智能音箱是否“聪明”的标准,而语义识别则是判断一个智能音箱是否有“智慧”的标准。智能音箱的语义识别之所以难,其实是难在中文,中文有声调、动词没有时态,不同方言下有不同语法等等,这些与英文不同之处,让类似于隐马尔科夫模型这类语音识别常用的计算模型未必能够适用于中文。
小度智能音箱之所以能够如此聪明、如此有智慧,也和百度自家的新一代深度语音识别系统Deep Speech 2有关。实际上,市面上绝大部分的智能音箱中内置的语音助手/语音系统都不是厂商自主研发的,而是采用的科大讯飞、搜狗等等的语音识别技术,而百度则例外。百度采用的是其实验室基于深度学习技术自主研发的Deep Speech 2语音识别系统,其中也运用了百度搜索引擎中大量的汉语音频数据,该技术的识别准确率高达97%。
因此,百度在做智能音箱方面相比其它厂商来说,是有天然的优势的,小度智能音箱能够在反应速度、容错率、语义识别等等方面做得比其它产品更加出色,也是合情合理。
儿童模式

第一句是儿童模式下的回复,第二句是正常模式下的回复
儿童模式是小度智能音箱专门为儿童推出的语音对话模式,在这个模式下,小度智能音箱的功能保持不变,但它的声音会变得可爱动人的小朋友的声音,同时它的聊天方式也会更加“儿童”,让小朋友更具亲切感。
在儿童模式下,小度智能音箱会亲切的称呼用户为“宝贝”,语调、语气、用词都会发生改变。而同样的一句话,若是用正常模式说,则完全是另外一种口吻和用词。

在家中,家长一定有这样的烦恼。小朋友会经常问一些很常识性的问题,而且大多数小朋友都有很大的好奇心,他们的问题往往很多,家长疲于回答,这个时候,小度智能音箱一定会是家长们的好帮手。
基于小度智能音箱强大的DuerOS系统,其内置了百度知道、百度百科、计算器以及丰富的教育资源,基本上能解决小朋友的所有疑问。例如小编连续的说出一长串数字进行计算,小度智能音箱仅仅用了不到1秒的时间就给出了回复,以及一些常识性问题例如“唐太宗是唐朝的第几位皇帝”、“为什么日本会经常发生地震”、“1997年香港金融危机的起因是什么”、“索罗斯是什么人”等等,小度智能音箱基于百度知道、百度百科这两大武器,在非常短的时间内就能马上给出答案,不仅会通过语音播报的方式将答案说出来,同时在手机App小度音箱上也能体现,这个时候小朋友可以点击App中的链接,查看更详细、更全面的解答。
儿童模式下,当用户向小度发出音乐、故事、听书等指令时,小度优先播放更适合小朋友的内容,例如当你在儿童模式时说来点音乐的时候,它就会播放儿歌,而这个场景若是发生在正常模式下,小度则会播放流行音乐。
极客模式
极客模式也是小度智能音箱的一大特点,在该模式下,小度智能音箱会变得非常强劲,不仅回答迅速,而且在8秒内无需唤醒,就能马上响应用户的问题。
用户可以通过“进入极客模式”的语音指令让小度智能音箱进入极客模式,在此模式下,小度智能音箱在每次应答完后还预留了8秒的对话时间间隙,在这8秒内,用户无需通过“小度小度”唤醒音箱也同样可以进行语音操作。
极客模式
用户:小度小度,今天天气怎么样?
小度播报今天天气
用户:那明天呢?
小度播报明天天气
用户:那后天呢?
小度播报后天天气
极客模式与普通模式的最大的区别就是无需再次唤醒小度智能音箱,因此使用此模式的用户往往会催生更多的对话需求,这个时候语义识别的重要性就体现了。在极客模式这种场景中,用户的对话很可能具有连贯性,而就像小编上文所提到的那样,小度智能音箱的语义识别非常精准,再结合DuerOS庞大的资源库和有声内容,它能够在极客模式下给用户更好的体验。
音质

