打响指教学新手入门,怎么打响指最专业教程

首页 > 经验 > 作者:YD1662024-03-27 09:30:18

提到“打响指”这个限定的声音情境,你的脑海中会联想到什么?

是电影中,打个响指让愿望实现、反派团瞬间被全灭、主角即将展现高光时刻;还是正发着呆,被好友一个响指唤醒回神;魔术师施展魔法,凭空变出鲜花......

在这里,就要和各位介绍一个能听懂你所想,且能联动米家操作的新功能——“打个响指”。它到底凭借什么被“委以重任”为控制设备的触发条件?又能带来怎样的惊喜?

响指一打,设备懂你

小米澎湃OS的推出,让设备互联进入「主动智能」时代。突破性的 Xiaomi HyperMind 全设备思考中枢可以让你身边的设备成为感知世界的触角。统一思考,多维感知判断,主动学习用户习惯,真正把小米生态中的各类设备打通,并以人为中心提供主动服务,让设备更懂人。“打个响指”就是基于 Xiaomi HyperMind 架构下推出的新功能。

目前,市面上常见的交互式语音指令,都需要多轮对话操作。而此次随着小米澎湃OS一起推出的“打个响指”功能,一个响指,就能让多设备自主运行。不仅操作流程简单、直接,还能指令直达、主动感知,让家闻“声”而应!

作为行业首发的使用用户动作唤醒 识别 触发操作的技术,相比于传统的语音唤醒和下达指令而言,不仅是唤醒方式上的一个创新,更是小米在声音事件感知、通用声音识别上先进能力的体现。

而我们在众多声音情境中选择响指声识别的原因,不仅是“响指”声音具有场景特殊性,不太容易被误触发、或被环境中的其他声音模拟,而且打响指联动米家本身就很酷!能给用户带来更好的使用体验、更高的识别准确度。

打响指教学新手入门,怎么打响指最专业教程(1)

通常情况下,大家在唤醒小爱同学下达相应的指令时,都需要先进行唤醒、再等待小爱同学回应、再下达指令、再等待小爱同学执行等步骤,而打响指技术则完全不需要这一系列流程。

你只需要有一个 Xiaomi Sound 音箱,在米家 App 中设置好功能的自动化指令,音箱在开启状态下,会自动、持续感知周围的环境声音。打响指这一指令,只要在音箱方圆3米范围内,就能被精准识别和捕捉到,即可快速触发各类操作,唤醒准确率高达 96%。

应用演示:

此外,响指识别的算法完全在音箱端实现了本地部署,所有的声音在音箱内即完成了处理,不会上传云端,用户不必有隐私泄露的担心和困扰。

而为了避免误识别,负责这项算法的小米AI实验室也做了诸多优化,例如:在检测到周围播放音乐或者视频时,自动暂时屏蔽响指识别功能,防止音乐或电影里的响指触发误识别;在检测到类似于响指的声音时,算法会自动做两次鉴别操作,确保只有真正的响指声音才会唤醒;算法加入了对于声音距离的判断机制,防止窗外的某些声音误触发等等......

使用小tips:

玩转技术,多设备自主运行

历经十余年的积累,让小米的技术研发已经从应用层面更多转向了底层技术层面,其中 AI 领域是小米长期持续投入的底层赛道之一。

而小米 AI 实验室下的声学语音部门已具备从硬件到软件基础层,再到软件应用层的全链路声音算法能力,覆盖声音的理解与生成,其麦克风阵列拾音、语音识别、声纹识别、语音唤醒、语音合成等能力服务于数亿小米用户。

打响指教学新手入门,怎么打响指最专业教程(2)

响指检测的诞生,是基于小米持续研发的音频标记技术。该技术的目标是对音频作多标签分类,使计算机能够理解音频内容,可应用于音频搜索、危险事件识别、机器故障监测、辅助无障碍等广泛场景。

音频标记算法可以识别广泛的声音,有助于让环境中的声音也能用文字等其他模态同等地表达,让声音被“看”见。

打响指教学新手入门,怎么打响指最专业教程(3)

小米声学语音技术架构

▍场景一:使用无障碍

语音唤醒虽是市面上使用最多的,但并不适用于所有用户。例如对于言语障碍用户而言,无法直接语音唤醒小爱同学,且需要在手机上进行多次操作又较为繁琐。“打个响指”功能对其而言,就是一个很好的“小帮手”,能够主动感知、一次操作即可控制家庭设备,帮助他们向周围的设备直接下达指令,让生活更方便。

▍场景二:生活总会有惊喜

要说生活中什么东西,能令人一直铭记,想起来时嘴角又不自觉上扬。我想,应该是一场足够用心和有序又顺利的惊喜。在一个充满浪漫氛围的场景下,正深情地告白时,突然喊小爱同学帮忙打开灯光、播放音乐......这种煞风景的画面,光是脑补就觉得能尴尬到想直接原地隐身。那若是在告白前,将氛围灯、音乐等都提前设置好,现场部分环节交由响指来配合自动执行,那一切安排尽在掌握当中,留下美好又惊喜的回忆皆有可能了!一个响指,氛围感拉满!

▍场景三:闭麦时间到

下班回家,已经处于低电量模式下的我们,可能只想“闭麦”,独处修身养息。这时,只需站在玄关处打个响指,就能下达已经在后台设置好的相关指令,完成开灯、拉窗帘、打开加湿器、打开空气净化器、打开音箱播放音乐这一系列操作,无需再与小爱同学进行多轮对话和等待执行,直接进入个人放松模式。

深耕底层技术,AI 赋能产品

音频标记技术,是小米 AI 实验室研发积累的基础技术之一,它能够识别上百种自然声音,响指声只是其中之一。在深耕 AI 技术能力的过程中,小米 AI 实验室声学语音团队长久的积累和沉淀,让音频标记技术能够轻松实现技术的另一种玩法创新。同时,也在不断地认真聆听、洞察不同用户人群的真实需求,做出让更多人能够享受到主动、智能化的科技生活的产品。

除此之外,还能让机器能够听懂人类语言,理解自然界的千千万万种声音。就如同小米的人形机器人一般,它具备84种语义理解能力,帮助机器人认识周围的声音并做出反应,大幅提升了机器人的感知能力。

打响指教学新手入门,怎么打响指最专业教程(4)

首页 12下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.