什么是人工智能和核心技术,人工智能三大核心技术是什么

首页 > 经验 > 作者:YD1662022-11-01 09:37:05

什么是人工智能和核心技术,人工智能三大核心技术是什么(1)

近年来,中国人工智能高速发展。无人超市、无人物流、无人加油站、无人驾驶、无人酒店……再加上各种功能健全的机器人!在我们毫无察觉中,人工智能正在日夜不息地自我迭代进化,冲击着我们生活的方方面面。在这些令人诧异和振奋的事件背后,离不开计算机视觉、自然语言处理、生物特征识别及知识图谱等人工智能关键技术。可以说,在人工智能产业中,技术是连接芯片和应用场景的纽带,决定了产品的智能化程度。

计算机视觉人工智能系统的大门

什么是人工智能和核心技术,人工智能三大核心技术是什么(2)

根据实际解决的问题,计算机视觉技术可分为人脸识别、图像检测、图像检索、目标跟踪、风格迁移等几大板块。其中,人脸识别、图像分类等功能计算机视觉技术已经比人类视觉更精准、更迅速。在医院,一般早期食管癌检出率低于10%,而腾讯觅影通过扫描上消化道内镜图片筛查食管癌,检出率高达90%,且用时不到4秒。商汤科技宣称,利用其计算机视觉技术,视频内容审核能够节省99%的人工。

然而,虽然在解决识别、检测、聚类等问题上,计算机视觉已经可以超越人类,但其发展仍面临挑战。

首先,缺乏可用于人工智能模型训练的大规模数据集。缺乏标注数据是几乎所有应用场景普遍存在的挑战。当前的应用场景多以项目制形式落地,数据仍然在项目建设方,数据不能共享也无法形成闭环,也就导致技术的进步分散在各个企业的各个项目中,难以带来行业整体跨越。

其次,缺乏从技术到产品到规模化应用的工程化经验。计算机视觉技术的应用已不再是单一的软件应用,涉及到新型基础架构,涉及到新的数据分析流程,还涉及到智能硬件如摄像头的安装等等。每一个环节都可能会影响识别效果。将这一技术从实验室扩展到工业化应用的过程本身就是很大的挑战。

自然语言处理中国领先的人工智能技术

一个完整的自然语言处理系统包含语音识别、语义识别、语音合成三部分。其中,国内企业在语音识别和语音合成已处世界领先地位。

语音识别是指让计算机“听到”人的语音,目前已经比较成熟,尤其汉语的语音识别领先英语。根据2017年IBM、谷歌和微软发布的词错率进展数据,他们的识别率均在94%-95%之间,而在此之前,国内语音识别企业,如百度、搜狗、科大讯飞,识别率均已达到97%左右。

语音合成是指计算机将准备“回复”给人类的语句,通过合成音频的形式,利用扬声器外放。百度地图的语音导航、苹果手机的Siri助手背后都利用了语音合成技术,这项技术已日臻成熟。当前,科大讯飞的语音合成技术代表了世界领先水平。2018年科大讯飞打败卡内基梅隆等众多高校、科研机构和企业,连续13年赢得Blizzard Challenge(国际语音合成大赛)冠军。

区别于语音识别“听到”人类语言,语义识别更加强调“听懂”。当用户对智能系统说出一个饭店的名字,系统对用户语音进行识别,搜索饭店,这是“语音识别”;当用户对智能系统说“自助餐”、“海鲜”、“连锁店”等模糊语句,智能系统根据用户的性别、爱好、饮食倾向等特征进行智能分析,并精准推荐,则是“语义分析”。可见,语义识别比语音识别技术难度高好几个层次。

语义识别是当前自然语言处理发展的瓶颈,仍处于初级研究阶段。由于目前的人工智能技术只能把音变成字,字变成音,不能理解其中含义,很难实现基于场景的生动会话,商业落地的场景十分有限。

什么是人工智能和核心技术,人工智能三大核心技术是什么(3)

知识图谱人工智能的下一技术风口

知识图谱最初是由Google公司在2012年提出来的一个新的概念。从学术的角度,我们可以对知识图谱给一个这样的定义:“知识图谱本质上是语义网络(Semantic Network)的知识库”。但这有点抽象,所以换个角度,从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图(Multi-relational Graph)。如果说以往的智能分析专注在每一个个体,知识图谱则专注于这些个体之间的“关系”。知识图谱用“图”的表达形式,最有效、最直观地表达出实体间的关系,是最接近真实世界、符合人类思维模式的数据组织结构。

相较于传统的智能分析,知识图谱是基于图的数据结构,即知识图谱需要从海量信息中抽去多个维度的特征信息,并在这些特征信息素材的基础上,通过智能推理实现从数据到可视化图像深加工,从而能够直观易懂的展现给用户,并与用户交互。

什么是人工智能和核心技术,人工智能三大核心技术是什么(4)

首页 1234下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.