网络用语hhc啥意思,网络用语hwt是什么意思

首页 > 上门服务 > 作者:YD1662023-12-25 22:16:48

帮助人与人的交流 HHC:应用场景如,如翻译系统,微信沟通中的语音转文字,语音输入等功能。语音到语音(speech-to-speech,S2S)翻译系统,可以整合到像Skype这样的交流工具中,实现自由的远程交流。S2S组成模块主要是,语音识别-->机器翻译-->文字转语音,可以看到,语音识别是整个流水线中的第一环。

帮助人与机器的交流 HMC:应用场景如,语音搜索VS,个人数码助理PDA,游戏,车载信息娱乐系统等。

6

对话系统

要注意的是,我们上面所说的应用场景和系统讨论,都是基于【语音对话系统】的举例。

语音识别技术只是其中关键的一环,想要组建一个完整的语音对话系统,还需要其他技术。

语音对话系统:(包含以下系统的一个或多个)

语音识别系统: 语音-->文字

语义理解系统:提取用户说话的语音信息

文字转语音系统:文字-->语音

对话管理系统:1) 2) 3)完成实际应用场景的沟通

网络用语hhc啥意思,网络用语hwt是什么意思(5)

语音识别系统

语音识别问题,其实是一个模式识别的问题。给你一段声波,机器判别是a还是b。

这个过程有两大块,一个是生成机器能理解的声音向量。第二个是通过模型算法识别这些声音向量,最终给出识别结果。

每一块中间都有很多细小的步骤,我们后面会提到。

1

系统架构概述

下图是语音识别系统的组成结构,主要分4部分:

信号处理和特征提取、声学模型(AM)、语言模型(LM)和解码搜索部分。

网络用语hhc啥意思,网络用语hwt是什么意思(6)

左半部分可以看做是前端,用于处理音频流,从而分隔可能发声的声音片段,并将它们转换成一系列数值。

声学模型就是识别这些数值,给出识别结果。后面我们会详细解释。

右半边看做是后端,是一个专用的搜索引擎,它获取前端产生的输出,在以下三个数据库进行搜索:一个发音模型,一个语言模型,一个词典。

【发音模型】表示一种语言的发音声音 ,可通过训练来识别某个特定用户的语音模式和发音环境的特征。

【语言模型】表示一种语言的单词如何合并 。

【词典】列出该语言的大量单词 ,以及关于每个单词如何发音的信息。

a)信号处理和特征提取:以音频信号为输入,通过消除噪声和信道失真对语音进行增强,将信号从时域转化到频域,并为后面的声学模型提取合适的有代表性的特征向量。

b)声学模型:将声学和发音学的知识进行整合,以特征提取部分生成的特征为输入,并为可变长特征序列生成声学模型分数。

c)语言模型:语言模型估计通过训练语料学习词与词之间的相互关系,来估计假设词序列的可能性,又叫语言模型分数。如果了解领域或任务相关的先验知识,语言模型的分数通常可以估计的更准确。

d)解码搜索:综合声学模型分数与语言模型分数的结果,将总体输出分数最高的词序列当做识别结果。

2

语音识别技术详解

看完上面的架构图,你应该有个大致的印象,知道整个语音识别是怎么回事儿了。下面我们详细说一些重要的过程。

2.1 语音识别单元

我们的语音内容,由基本的语音单元组成。选择要识别的语音单元是语音识别研究的第一步。

就是说,你要识别的结果是以什么为基础单位的?是单词还是元音字母?

语音识别单元有单词 (句) 、音节和音素三种,具体选择哪一种,根据具体任务来定,如词汇量大小、训练语音数据的多少。

网络用语hhc啥意思,网络用语hwt是什么意思(7)

【音素】:在汉语里,最小的语音单位是音素,是从音色的角度分出来的。

【音节】:一个音素单独存在或几个音素结合起来,叫做音节。可以从听觉上区分,汉语一般是一字一音节,少数的有两字一音节(如“花儿”)和两音节一字。

网络用语hhc啥意思,网络用语hwt是什么意思(8)

上一页12345下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.