最近几年,人工智能大火,同时也引发了不少行业的兴起,智能音箱就是其中之一。作为人工智能落地的载体之一,智能音箱在设计的过程需要注意哪些问题呢?
随着智能语音技术的发展,各个公司对智能音箱的需求是越来越强烈,其中小米的小爱同学,阿里的天猫精灵和百度的小度音箱占到了市场份额的80%以上,我们今天就来聊一聊智能音箱设计过程中有哪些需要注意的地方。
一、ID设计
ID设计往往决定着消费者看到音箱的后的第一印象,根据目标用户的不同,ID设计的风格也有所区别。
一款外观能打动人的音箱,其实就已经成功了一半,那么ID到底该如何设计呢?
1. 和家居装修统一
因为对这类新产品比价感兴趣的以年轻人居多,年轻人中比较流行的是简约的北欧风,这时音箱的设计就要以简约为主,放在那里都不能显得太突兀。
以天猫方糖为例,简单的长方体,四角用弧线处理,看起来比较精致,简单,同时偏白的纯色处理,也使得方糖无论是放在客厅的茶几和卧室的床头柜上都不会显得太突兀,不经意看还以为是一件装饰品。
2. 和用户统一
音箱的使用者是孩子还是大人,如果是孩子,设计时往往要考虑稳定性,因为孩子可能会经常拿在手中,是否方便孩子把玩,放在某处时,是否容易倒下。
这点差异在天猫方糖和小爱同学就完美的体现了。小爱同学呈柱状,较高,重心偏上。
相比较方糖,小爱的稳定性肯定更差一点,但是小爱同学更像是一个装饰品,他的目标用户就不是孩子,所以在设计过程中就忽略了这一点。
3. 和功能统一
外观设计不仅仅是孤立的,外观上面肯定会有表示状态的灯阵和各种功能按键,设计师在设计外面时,肯定还要考虑这些功能按键和灯阵的效果是否整体统一。
如天猫精灵的灯阵在底部,配合黑色的圆柱外观,会显得很灵动,同时会降低重心的视觉感受。若把天猫精灵的灯阵放在顶部,可能效果就不会那么好。
二、功能设计
功能设计主要包含后端技能设计和前端业务逻辑。
1. 技能设计
技能就是一个音箱所包含的能力,如天气,时间,播放控制,智能家居控制,闲聊等等。
音箱本身是不具备这些能力的,只有通过后台的语义解析之后,命中了某个技能,后台再返回一个答案给音箱进行播报。
如:今天天气怎么样。后台的语义会进行一个分析,将一个句子拆成几个词的组合,今天、天气、怎么样。
这几个词分别去填充几个语义槽,这几个语义槽就是请求第三方信源的参数。第三方信源会根据请求,返回相应的字段,对话再将这些字段根据一定的规则拼成一句话。
那么在设计一个技能的时候,我们需要注意什么呢?
(1)技能解决的是什么问题
每个技能有明确的边界,超出这个边界的问题,都不会命中这个技能,所以我们一定要明确这个技能到底解决了什么问题,满足了用户什么样的需求。
如天气技能,只会回答天气,但是根据请求参数的不同,可以回答今天的天气,也可以回答明天的天气。
(2)技能需要支持的问法
比如天气技能,问法有很多,如:天气怎么样、今天天气怎么样,这两种应该都是问的当天的天气,第一种没有问哪一天,那我们就可以默认回答一个当天的天气。
当然如果想要做的更好,我们还可以根据时间来判断,如晚上九点以后问天气怎么样,我们可以回答明天的天气。
当然想要产品经理一个人考虑全所有的问法,是不可能的。产品经理只能例举出有限的几十条问法,剩下的就需要一个数据组的妹子去天天看数据了,看看哪些问法是问天气的,但是我们的问法中还没有包含的。
(3)槽位设计
问法有了,这个时候就需要产品经理去归类,很多问法可以归为一类,如:天气怎么样和今天天气怎么样就可以归为一类,用正则表达式表示就是:[今天]天气[怎么样|如何];
今天就可以归为一个槽位,叫日期,这个槽位不是必填;天气是一个槽位,必填;怎么样|如何也是一个槽位,必填。
(4)NLG设计
技能命中了,返回字段也有有了,这个时候就要设计该如何回复,这个回复尽量要满足提问者的提问方式。
如问题:今天温度是多少?回答:今天温度28摄氏度。
如果回答今天多云,那就是不太合理的。这也是要根据上面问法及槽位设计来判断用户的意图,看用户到底问的是什么,然后再合成相应的答案。
2. 前端业务逻辑设计
前端业务逻辑设计根据不同的功能都不一样,这里不能一一详细的介绍。我们就拿蓝牙配网流程来简单说一下。
(1)设备开启蓝牙
两种方式:语音开启,按键开启。目前主流的方法是按键长按开启蓝牙。
为什么要这么设计,因为一旦进入配网模式,音箱所有功能都没办法使用,所以一般不会轻易进入配网模式,而语音很容易误触发,尤其是离线语音,更容易误触发。
这里面还需要考虑的是,进入蓝牙配网模式的超时机制。
(2)APP连接蓝牙
这里需要注意的是,设备蓝牙名称一定要有一个固定前缀,这个是用来和其他蓝牙名称区别开,方面APP在搜索时,可以过滤掉其他的蓝牙设备。
(3)连接网络
这里要考虑的是鉴权机制,就是是否允许任何一个APP用户来绑定这台音箱。
roobo的机制是,只有这台设备解绑之后,才会允许另一个人去绑定,而其他家,基本都是任何用户都可以去绑定。
这主要是因为roobo的设备带有摄像头,所以在隐私这一块做的比较好。
(4)灯阵和TTS提示设计
这部分主要是为了区分音箱当前的不同的状态和引导用户进行操作,这里就不详细介绍了,灯阵原则就是符合音箱当前状态,如断网状态,请求状态和联网状态。
灯阵的转动、闪动和颜色一定要符合音箱当前的状态。TTS提示的原则:简单明了。
结语
因为没有火狐浏览器,所以这篇文章没有办法插入图片,感谢大家耐心看完。
对于音箱这种无界面的交互,往往比较难,只有不断的去试错,去看市场的反馈,不断的打磨,才能做出一款好的音箱,我是一个音箱产品经理,我为自己带盐。
本文由 @jinyu 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。