狼为什么会选择直接撞死呢?
因为自*分数最高:
如果抓羊,在狼学会躲避障碍物之前它是碰不到羊的。假设前5w次狼做了一些绕开障碍的尝试但是都死了。
那他通过这5w次学到的东西就是——
原地站着15秒得-1.5分;
一头扎死得-1.1分;
尝试绕路但是撞死得-1.1 到-2.4分。
所以由于狼根本没有吃到过羊,因此狼在-1.1到-2.4分之间选择了-1.1,也就是自*。
那么不懂强化学习的网友们如何看待这件事呢?
连人工智能都开始知道拒绝内卷了
网友们眼很尖心很细,把AI狼自*和内卷联系到了一起:
狼为什么会选择直接撞死呢?
因为自*分数最高:
如果抓羊,在狼学会躲避障碍物之前它是碰不到羊的。假设前5w次狼做了一些绕开障碍的尝试但是都死了。
那他通过这5w次学到的东西就是——
原地站着15秒得-1.5分;
一头扎死得-1.1分;
尝试绕路但是撞死得-1.1 到-2.4分。
所以由于狼根本没有吃到过羊,因此狼在-1.1到-2.4分之间选择了-1.1,也就是自*。
那么不懂强化学习的网友们如何看待这件事呢?
连人工智能都开始知道拒绝内卷了
网友们眼很尖心很细,把AI狼自*和内卷联系到了一起:
Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.