什么是人工智能和核心技术（人工智能三大核心技术是什么） - 原点资讯

什么是人工智能和核心技术,人工智能三大核心技术是什么(1)

近年来，中国人工智能高速发展。无人超市、无人物流、无人加油站、无人驾驶、无人酒店……再加上各种功能健全的机器人！在我们毫无察觉中，人工智能正在日夜不息地自我迭代进化，冲击着我们生活的方方面面。在这些令人诧异和振奋的事件背后，离不开计算机视觉、自然语言处理、生物特征识别及知识图谱等人工智能关键技术。可以说，在人工智能产业中，技术是连接芯片和应用场景的纽带，决定了产品的智能化程度。

计算机视觉人工智能系统的大门

什么是人工智能和核心技术,人工智能三大核心技术是什么(2)

根据实际解决的问题，计算机视觉技术可分为人脸识别、图像检测、图像检索、目标跟踪、风格迁移等几大板块。其中，人脸识别、图像分类等功能计算机视觉技术已经比人类视觉更精准、更迅速。在医院，一般早期食管癌检出率低于10%，而腾讯觅影通过扫描上消化道内镜图片筛查食管癌，检出率高达90%，且用时不到4秒。商汤科技宣称，利用其计算机视觉技术，视频内容审核能够节省99%的人工。

然而，虽然在解决识别、检测、聚类等问题上，计算机视觉已经可以超越人类，但其发展仍面临挑战。

首先，缺乏可用于人工智能模型训练的大规模数据集。缺乏标注数据是几乎所有应用场景普遍存在的挑战。当前的应用场景多以项目制形式落地，数据仍然在项目建设方，数据不能共享也无法形成闭环，也就导致技术的进步分散在各个企业的各个项目中，难以带来行业整体跨越。

其次，缺乏从技术到产品到规模化应用的工程化经验。计算机视觉技术的应用已不再是单一的软件应用，涉及到新型基础架构，涉及到新的数据分析流程，还涉及到智能硬件如摄像头的安装等等。每一个环节都可能会影响识别效果。将这一技术从实验室扩展到工业化应用的过程本身就是很大的挑战。

自然语言处理中国领先的人工智能技术

一个完整的自然语言处理系统包含语音识别、语义识别、语音合成三部分。其中，国内企业在语音识别和语音合成已处世界领先地位。

语音识别是指让计算机“听到”人的语音，目前已经比较成熟，尤其汉语的语音识别领先英语。根据2017年IBM、谷歌和微软发布的词错率进展数据，他们的识别率均在94%-95%之间，而在此之前，国内语音识别企业，如百度、搜狗、科大讯飞，识别率均已达到97%左右。

语音合成是指计算机将准备“回复”给人类的语句，通过合成音频的形式，利用扬声器外放。百度地图的语音导航、苹果手机的Siri助手背后都利用了语音合成技术，这项技术已日臻成熟。当前，科大讯飞的语音合成技术代表了世界领先水平。2018年科大讯飞打败卡内基梅隆等众多高校、科研机构和企业，连续13年赢得Blizzard Challenge（国际语音合成大赛）冠军。

区别于语音识别“听到”人类语言，语义识别更加强调“听懂”。当用户对智能系统说出一个饭店的名字，系统对用户语音进行识别，搜索饭店，这是“语音识别”；当用户对智能系统说“自助餐”、“海鲜”、“连锁店”等模糊语句，智能系统根据用户的性别、爱好、饮食倾向等特征进行智能分析，并精准推荐，则是“语义分析”。可见，语义识别比语音识别技术难度高好几个层次。

语义识别是当前自然语言处理发展的瓶颈，仍处于初级研究阶段。由于目前的人工智能技术只能把音变成字，字变成音，不能理解其中含义，很难实现基于场景的生动会话，商业落地的场景十分有限。

什么是人工智能和核心技术,人工智能三大核心技术是什么(3)

知识图谱人工智能的下一技术风口

知识图谱最初是由Google公司在2012年提出来的一个新的概念。从学术的角度，我们可以对知识图谱给一个这样的定义：“知识图谱本质上是语义网络（Semantic Network）的知识库”。但这有点抽象，所以换个角度，从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图（Multi-relational Graph）。如果说以往的智能分析专注在每一个个体，知识图谱则专注于这些个体之间的“关系”。知识图谱用“图”的表达形式，最有效、最直观地表达出实体间的关系，是最接近真实世界、符合人类思维模式的数据组织结构。

相较于传统的智能分析，知识图谱是基于图的数据结构，即知识图谱需要从海量信息中抽去多个维度的特征信息，并在这些特征信息素材的基础上，通过智能推理实现从数据到可视化图像深加工，从而能够直观易懂的展现给用户，并与用户交互。

什么是人工智能和核心技术,人工智能三大核心技术是什么(4)