这个库是由World Model的一作David Ha开发的实用estool库改编的,他用Keras和TensorFlow后端实现了神经网络的训练。
2.设置虚拟环境
我们需要创建一个Python 3虚拟环境(我用的是virutalenv和virtualenvwrapper)
3.安装包
4.安装requirements.txt
第四步:生成随机rollout对于赛车环境来说,VAE和RNN可以用于随机的rollout数据上——也就是说,在每一个时间步中随机采取行动产生的观测数据。实际上,我们使用的是伪随机动作,最开始会强迫汽车加速,让它脱离起跑线。
由于VAE和RNN独立于决策控制器,所以需要保证我们提供各种各样的观察结果,和各种各样的动作,将它们存为训练数据。
要生成随机的rollout,可以从命令行运行以下指令: