horses怎么发音,horses的单词怎么读

首页 > 教育 > 作者:YD1662024-04-05 07:20:10

编辑:LRS

【新智元导读】AI模型不光要学会理解语言,还得成为语言学家!

试图让计算机理解人类的语言一直是人工智能领域迈不过的难关。

早期的自然语言处理模型通常采用人工设计特征,需要专门的语言学家手工编写pattern,但最终效果却并不理想,甚至AI研究一度陷入寒冬。

每当我开除一个语言学家,语音识别系统就更准确了。

Every time I fire a linguist, the performance of the speech recognizer goes up.

——Frederick Jelinek

有了统计模型、大规模预训练模型以后,特征抽取是不用做了,但仍然需要对指定任务进行数据标注,而且最关键的问题在于:训练得到的模型还是不懂人类的语言。

horses怎么发音,horses的单词怎么读(1)

所以,我们是不是该从语言最初的形态开始重新研究:人类到底是怎么获得语言能力的?

最近来自康奈尔大学、麻省理工学院和麦吉尔大学的研究人员在Nature Communications上发表了一篇论文,提出一个算法合成模型的框架,在人类语言的最基础部分,即词法音位学(morpho-phonology)上开始教AI学习语言,直接从声音中构建语言的词法。

horses怎么发音,horses的单词怎么读(2)

论文链接:https://www.nature.com/articles/s41467-022-32012-w

词法音位学是语言学分支之一,主要关注语素(即最小的意义单位)在组合成词时发生的音变,试图给出一系列规则,以预判语言中音素的规律变声。

比如说英语中的复数语素写作-s或是-es,但读音却有三种[s]、[z] 及 [әz],比如cats的发音为/kæts/, dogs的发音为/dagz/, horses的发音为/hɔrsәz/。

人类在学习复数发音转换时,首先根据词法学(morphology),意识到复数后缀实际上是/z/;然后根据音位学(phonlogy),将后缀基于词干中的声韵,如清辅音等转换成/s/或/әz/

horses怎么发音,horses的单词怎么读(3)

其他语言也有同样的音位词法规律,研究人员从58种语言的音位教科书上收集得到了70个数据集,每个数据集只包含几十到几百个单词,并且只包含少数语法现象,实验表明在自然语言中寻找语法结构的方法也可以模拟婴儿学习语言的过程。

通过对这些语言数据集执行分层贝叶斯推理(hierarchical Bayesian inference),研究人员发现该模型仅从一个或几个样例中就可以获取新的词法音位规则,并且能够提取出通用的跨语言模式,并以紧凑的、人类可理解的形式表达出来。

让AI模型做「语言学家」

人类的智能主要体现在建立认知世界理论的能力,比如自然语言形成后,语言学家总结了一套规则来帮助儿童更快速地学习特定语言,而当下的AI模型却无法总结规则,形成一套其他人可理解的理论框架。

在建立模型之前要解决一个核心问题:「如何描述一个词」,比如说一个词的学习过程包括了解词的概念、意图、用法、发音以及含义等。

在构建词表时,研究人员把每个词表示为一个<音标,语义集合>对,例如open表示为</opεn/, [stem: OPEN]>, 过去式表示为</d/, [tense: PAST]>,组合得到的opened表示为</opεnd/, [stem: OPEN, [tense: PAST]]>

horses怎么发音,horses的单词怎么读(4)

首页 123下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.