王者荣耀ai绝悟模式会得到什么（王者荣耀ai人机绝悟在哪里） - 原点资讯

本文作者：NGA-43097891

王者荣耀ai绝悟模式会得到什么,王者荣耀ai人机绝悟在哪里(1)

相信大家这几年或多或少都听过深度学习这个概念。绝悟AI正是深度学习的产物，更确切说绝悟AI的核心是深度强化学习(Deep Reinforcement Learning)。本人粗略阅读腾讯AI lab 叶德珩博士一作的论文<Mastering Complex Control in MOBA Games with Deep Reinforcement Learning>[1](链接在文末参考文献中)，此文发表的人工智能的顶会2020 AAAI上面(虽然这个会议的水平个人感觉最近有些下降)。下面本人结合论文和一些资料，对绝悟的内部原理细节做进行阐述。

首先是背景，相信大家应该都听过围棋AI-AlphaGo。之前的阿尔法狗一战成名让强化学习名声大噪。之后便有各种游戏AI，例如DeepMind的星际争霸的AI与OpenAI的Dota2的AI，这两个比较早，因该是两三年之前。之前便取得不错的成绩，因为本人是刀塔玩家，所以当时TI比赛期间见过AI 5v5 明星挑战赛。下面将绝悟与go做个对比：

王者荣耀ai绝悟模式会得到什么,王者荣耀ai人机绝悟在哪里(2)

上面主要介绍绝悟AI在1v1的环境下，相比于Go的计算复杂度上面，以Action space(直译动作空间)为例王者荣耀的每一帧的操作可以分解为100 个离散的动作(比如位移，点击技能，点击攻击按键等)，这里的9000帧每局游戏应该是考虑到人类的反应时间而设置的帧数。所以我们可以看到，游戏AI的复杂度是很高的。

下面还需要提出两个概念，智能体(agent)和游戏单元(game unit)，智能体可以简单理解为英雄，游戏单元包括小兵，野怪，防御塔之类。由于1v1难以获取高效的数据(叶博士说1v1练英雄比较多)，所以采用无监督学习的方式，采用自对弈的方式(即我训练我自己)。下面正式进入绝悟的细节：首先是系统架构方面，也是就是绝悟AI的整体到底是个什么东东。

王者荣耀ai绝悟模式会得到什么,王者荣耀ai人机绝悟在哪里(3)