斗兽棋由来,斗兽棋的由来历史故事

首页 > 体育 > 作者:YD1662024-02-07 21:44:12

AhphaGo v. 李世石

AlphaGo Master:最神秘的棋手

在 Alphago 战胜李世石的时刻,很多人都以为 AlphaGo 是围棋棋力的巅峰了。可就在短短几个月之后,一个名为 Master 的账号突然出现在围棋的在线对弈平台上,各种挑战世界最顶尖的棋手,平均每天下10场棋,场与场之间还不怎么休息。就这样几天的功夫一连胜了59场,把大家知道的不知道的各位围棋世界冠军给打了个遍。这到底是谁呢?终于,Master 在围棋平台的聊天室说话了:“我是 AlphaGo 的黄博士”。原来,Master 是 AlphaGo 的升级版。

Master 与最初的 AlphaGo 相比,最大的改动是把策略网络和估值网络合并为了一个网络。当估值网络非常准确的时候,就不需要策略网络和快速走子网络来预测终盘胜负了。Master 的这个优化,把棋力从AlphaGo的3739分提高到了4858分。

AlphaGo Zero:围棋21天从入门到精通

比 AlphaGo Master 还厉害的,是大名鼎鼎的 AlphaGo Zero。

AlphaGo Zero 突破了人类上千年来围棋定式的限制,从完全不会围棋到水平超过 AlphaGo 只花了21天。

斗兽棋由来,斗兽棋的由来历史故事(9)

AlphaGo训练到第四十天即打败天下无敌手

德扑:没有感情的打牌机器

AI 征服了围棋这个高点之后,在棋类之外的游戏也是芝麻开花节节高。2017年初,美国的卡耐基梅隆大学开发了一个德州扑克的 AI,来和4名顶尖的人类选手对战。这一战就大战了二十天,总共打掉了12万张手牌。最后呢,AI 赢了。

斗兽棋由来,斗兽棋的由来历史故事(10)

美国的卡耐基梅隆大学开发了一个德州扑克的 AI

打牌和下棋的一个区别是,信息不完整、不对称:下围棋能看到整个棋盘,而打牌只能看到自己的手牌;如果有一轮对方的行动没有看清楚,就无法推算出对方的手牌并安排自己接下去的打法。所以打牌的AI,不能用传统的大数据和深度学习,而是要用博弈论、概率、运筹策略,一边打一边尽可能提高胜率。

人类打牌玩的是个心理战术,时不时虚张声势一下、把人唬得一愣一愣的。而这个打牌 AI ,是个没有感情的打牌机器。要我来改进它的话,我就给加个表情识别系统,看看他人类是真的有手好牌、还是在骗机器人呢。

AlphaStar:把职业选手都打懵了

在即时战略游戏(RTS)里,除了信息不对称的问题以外,玩家还得反应快、拼手速、时不时来一波极限操作。

斗兽棋由来,斗兽棋的由来历史故事(11)

AlphaStar 现学现卖

2019年初,DeepMind 带着 AlphaStar 开启了星际争霸2的人机对战。在这个号称人类历史上最复杂的 RTS 里,玩家每一秒钟要作出高达100种判断,打出最高每分钟600次的操作。

尽管 AlphaStar 的手速被限制到了每分钟只有280个操作,两位人类职业选手都以 0:5 惨败给了 AlphaStar。AlphaStar 不仅运营稳健,还展现了“野兵营”打法、偷师了“堵路口”技巧;其精湛的凤凰拖拉和闪烁追猎操作更是,把职业选手都打懵了。

比赛前,AlphaStar 用机器学习,仅仅学了7天就达到了职业选手的水平。整个学习过程类似 AlphaGo,模仿暴雪游戏平台的人类玩家,通过自我对战,让这个机器模型能读入一系列场上实时的数据,然后输出一系列具体的游戏操作。

结语

回顾历史,人机对战几十年,硬件的发展和算法的进步带给了人类非常多的惊喜。有的人可能会觉得,既然 AI 下棋已经能超过人类,那么人类为什么还要学习下棋甚至把它当作终身的职业呢?这就像人类发明了汽车,但还是会在奥运会上赛跑一样。AI 的出现并不会影响人类对于下棋的热情,而是会更加激励人们对棋路创新乃至大脑思维潜能的探索。

AlphaGo 之后,围棋的话题度明显提升,从棋手樊麾输给 AlphaGo 开始,欧洲各个围棋协会的网站访问量都比原来增加了10倍。樊麾也在 AlphaGo 的陪练下精进了棋艺,再次获得了欧洲围棋冠军。

就像 AI 从人类对局中提取玩法一样,人类也从 AI 的走法中得到了启发,人类和 AI 在相互学习中彼此成就

(这是视频的文字整理版,视频请点击原址)

,
上一页123末页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.