编辑:编辑部
【新智元导读】当猩猩学会玩《我的世界》,方法居然和英伟达科学家训练GPT-4智能体的方法一致?注意,这位玩家正在熟练地玩着《我的世界》,ta游刃有余地进行着收集零食和打碎积木的操作。
镜头一转,我们才发现:玩家的真实身份,竟然是一只猩猩!
没错,这是一项来自「猩猩行动计划(Ape Initiative)」的非人类生物神经网络实验。
而实验的主角Kanzi,是一只42岁的倭黑猩猩。
经过训练后,它学会了各种技能,挑战了乡村、沙漠神殿、下界传送门等环境,一路通关到达终点。
而AI专家发现,猩猩训练师教会它学技能的过程,竟然跟人类教AI玩Minecraft有诸多类似之处,比如上下文强化学习、RLHF、模仿学习、课程学习等。
当猩猩学会玩《我的世界》
Kanzi是来自Ape Initiative的一只倭黑猩猩,它是世界上最聪明的猩猩之一,听得懂英语,还会使用触摸屏。
在Ape Initiative,Kanzi能接触到各种电子触摸屏,这或许为它快速上手《我的世界》打好了基础。
人们第一次向Kanzi展示《我的世界》时,它一坐到屏幕前就发现了绿色的箭头,然后用手指划向了这个目标物上。
学习三种技能才不过几秒钟,Kanzi就发现了该怎样在《我的世界》中移动。
随后,它还学会了收集奖励。
每收集一个奖励,它都会得到花生、葡萄、苹果之类的零食奖励。