siri 中文啥意思,siri的真正含义

首页 > 国学 > 作者:YD1662023-04-16 23:26:46

上面提到的小姐姐们都是人工智能的衍生产物,语音助理。

她们的完成任务的主要过程是:

把人的发音转化成文字→理解意思(拆分,抓取关键信息)处理信息做出反馈(完成你布置的任务或者是调戏回来)

这其中用到了一项科技:自然语言处理 ,以下简称 NLP (Natural Language Processing ) 。这项技术是人工智能和语言学的分支。

siri 中文啥意思,siri的真正含义(9)

注:NLP是一门很深奥的学问,涉及了大量数学模型和计算机理论知识。本文为了可读性,牺牲了一定(大部分)严谨(准确)性,如有 NLP 大神觉得有误,请轻轻拍打差评君的脸(喂,不要抚摸!)

差评君来稍微说一下语音转文字的过程~

声音是一种波,当你的智能设备收到你的话的时候,其实是收到了声波。

首先,这段声波会被剔除掉噪音,然后被截成很小的单位,小到不能再小(比如说人民币现在最小只能到 “ 分 ”)

机器会把每 3 个(可能不止 3 个)最小单位会组成一个音素。(音素是发音的最小单位)

最后,根据这些音素可以组成文字。

最小单位组成音素

siri 中文啥意思,siri的真正含义(10)

图片引用自知乎用户@张俊博的回答

相信大家多半看蒙了,举个简单的例子(为了科普,此例子不太严谨)小黑胖说了一句 “ 我想吃鸡腿 ”。

语音识别系统会把这句话拆分成最基本的单位状态,再把最基本状态*成 w,o, x,i,ang, ch,i, j,i, t,ui 这么多个音素,再根据自身样本数据,分析这些音素组成哪些字的概率最大,根据统计学的原理来还原成文字。

(其实中文还涉及到了同声字多,存在音调等问题,实际处理时远比差评君这里说的复杂)

至此,已经把语音变成文字,为了防止人工智能变成人工智障,接下来 AI 小姐姐们就要从文字中试图理解语义并且做出反应了~

siri 中文啥意思,siri的真正含义(11)

对于计算机来说,理解语义的第一步是拆分语句。把 “ 我想吃鸡腿 ” 拆分成 “ 我/想/吃/鸡腿 "。然后,抓取有可能是命令的关键信息,例如我/想/吃。再分析额外信息,鸡腿!

接着,AI 小姐姐会处理这句话,找出相应的应对措施:吃 -> 找个饭店,鸡腿 -> 鸡肉料理

小姐姐就会觉得你是想找鸡腿吃了!然后直接调查数据库,找配对。最终输出结果:

siri 中文啥意思,siri的真正含义(12)

上一页12345下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.