而就算是汽车的驾驶舱,不同的厂商处理能力也完全不一样,Tesla的处理表现是非常优雅的。
经历过功能机年代的人都知道,那个年代实体键盘占据屏幕的一大部分,而当前的手机键盘仅仅在需要出现的时候出现,类似的例子实在是太多了。
故而内容展示的合理程度,也应该成为一个评测标准。
就算是复杂的内容,也需要做好信息处理,根据用户的情况,分层次分阶段,进行内容展示。
为了帮助大家理解,我举几个语音交互层面的例子。
比如说,大家周末相约到你家聚会,有些同学由于不熟悉路况,然后打电话给你。你通过语音跟对方完成指路行为。注意,这是一个纯语音对话的场景。
一般情况下,你采用的的话术表示是东南西北,一二三四某个街道楼栋门牌号这类语言结构,这种固然没什么问题,但是往往是对空间感较好的男生比较友好。
而这类话术在女生那边就不那么管用了,她们熟悉什么呢?商店品牌,广告牌标识,建筑形状,颜色等等,所以你自然就应当调整自己的话术,相信她们会更接受。
上述例子就是基于用户的情况,去设计自己的话术呈现。
前面一个智能厨房的场景,询问如何做菜,一般会给予视频推荐。如此,解放双手,边看边听边做,这个是我们想象的美好场景。
如果内容不加以控制和处理的话,用户的使用路径是,先看视频后做菜,或者是边看视频边做菜。如此,大概率会出现,一看就会,一做就废的情况。
原因无他,信息过载,细节过多,记不住。
而对内容进行管理,加以处理的话,合理的处理分层次分阶段,体验便能再上升一个台阶。
上述例子就是基于分层次分阶段,去设计自己的内容呈现。
笔者曾经设计过一些语音交互游戏。在进行业务教学的时候,曾经走过类似的弯路。
往往我们一开始是需要向用户介绍基本状态,以及基本操作指令的,在介绍游戏指令的时候,有这一段描述:
……游戏的命令列表分别是:“继续”、“重复一遍”、“下一步”、“退出游戏”。
问题1:命令列表是计算机语言,不具备亲和力,更好的表述应该是替换成你可以对我说:
而在后续实际的体验过程中,以及观察用户实际使用情况是:
当AI讲完,用户并不知道接下来该怎么办,顿在那里里发呆。
当AI讲完,用户走神没听清楚,也忘记了前面“重复一遍”的命令列表。脱口而出你说啥?
问题2:一开始用户拿到这一串命令的时候,其实是不知所措的,就好比跟你念了一段说明书。因为信息过载,而可能会遗漏掉某些信息。
这就是语音交互的尴尬所在,操控命令无法图形化显示,只能想办法在用户需要的时候提示。(这就非常考量出现的时机)而交代也需要细节,比如:
AI:说“继续”进入下一步。
用户:继续进入下一步。我们真的不希望用户如此表述。
问题3:我们期望用户的表述,与预想不符,而修订后的是
助手:进入下一步请说“继续”
类似的例子还能列举很多,无论是GUI还是VUI,对用户一股脑呈现,不加以管理是非常不负责的。
在自然语言处理领域,特别是纯语言的表述,逻辑顺序非常非常重要。所以我提炼成,内容展示合理程度,故而列为评测点。
5. 兜底处理表现尽管我们都希望自己的智能助手能够给予最好的回复。
而在实际的业务中,总会有一些搞不定的情况。
此处搞不定分为两种,一种情况是,AI听懂了,但是需求超出范围,如何回复?
另外一种情况是,AI真的没听懂,但是能猜测一个大概,但拿不准,如何回复?
实际业务中的解决方案,每个业务单元处理均不一致。
私以为常见的处理方案如下。
下面的这个例子中,有什么理财推荐和我想买理财其实意图近似,但是AI则根据自己的理解,给予了两种不同的处理方案。
下面的三个例子中,其实都是归属于成功理解意图,但是回复不一致。