gym模块如何安装,windows能安装gym吗

首页 > 实用技巧 > 作者：YD1662024-01-02 22:09:04

代码实现为：

key = "%d_%s"%(s, a)

#与环境进行一次交互，从环境中得到新的状态及回报

s1, r, t1, i =grid.step(a)

key1 = ""

#s1处的最大动作

a1 = greedy(qfunc, s1)

key1 = "%d_%s"%(s1, a1)

#利用qlearning方法更新值函数

qfunc[key] = qfunc[key] alpha*(r gamma * qfunc[key1]-qfunc[key])

评论：对于表格型值函数更新过程，我们看到每次更新只影响表格中的一个值，而不会影响行为值函数的其他值，这与行为值函数逼近方法不同。表格型强化学习算法效率很高，一般经过几次迭代后便能收敛。全部代码请参看github.gxnk中的qlearning。qlearning 算法的测试在文件learning_and_test.py中

第2小节：基于策略梯度算法实现详解

该部分需要用到tensorflow和画图库，所以大家先安装一下cpu版的tensorflow。

2.1 Tensorflow的安装：

Step1: 在终端激活虚拟环境（如何安装在上一讲）：source activate gymlab

Step2: 安装的tensorflow版本为1.0.0， python=3.5如下命令：

gym模块如何安装,windows能安装gym吗(5)

根据该命令所安装的tensorflow是无gpu的，无gpu的tensorflow对于学习毫无障碍。当然，如果大家做项目，建议安装gpu版的tensorflow.

Step3: 安装一个绘图模块, 命令为：

pip3 install matplotlib

2.2 策略梯度算法理论基础

本专栏的第六讲已经给出了策略梯度的理论推导，策略梯度理论表明随机策略的梯度由下式给出：

gym模块如何安装,windows能安装gym吗(6)

当随机策略是高斯策略的时候，第六讲已经给出了随机梯度的计算公式。当随机策略并非高斯策略时，如何优化参数？

对于小车倒立摆系统如下图2.2所示。

gym模块如何安装,windows能安装gym吗(7)

图2.2 小车倒立摆系统

上一节我们已经深入剖析了gym环境的构建。从小车倒立摆的环境模型中，我们不难看到，小车倒立摆的状态空间为

gym模块如何安装,windows能安装gym吗(8)

上一页 123 4 5 下一页

栏目热文

gym包安装视频教程（windows能安装gym吗）
阅读全文>>2024-01-02 22:11:52
查看gym版本（gym all 安装出错）
阅读全文>>2024-01-02 22:54:18
gym怎么打开（下载gym环境）
阅读全文>>2024-01-02 22:09:52
gym库的基本使用方法（gym库配置要求）
阅读全文>>2024-01-02 22:49:07
使命召唤战区画面a卡最佳设置（使命召唤战区怎样设置画面流畅）
阅读全文>>2024-01-02 22:51:39
gym 可以在windows使用吗（win7中如何安装gym）
阅读全文>>2024-01-02 22:50:44
gym使用教程（gym课程教学）
阅读全文>>2024-01-02 22:53:36
洛克王国游戏币怎么弄最快（洛克王国游戏币如何快速得）
阅读全文>>2024-01-02 22:52:03
洛克王国金币怎么快速得（洛克王国现在怎么赚金币）
阅读全文>>2024-01-02 22:29:46
洛克王国快速赚金币（洛克王国怎么赚rmb）
阅读全文>>2024-01-02 22:24:05

文档排行

本站推荐

侧面怎么拍建筑物（怎么拍建筑物才好看）
阅读全文>>2023-10-25 15:41:57
信用社算国企吗（信用社和国企哪个好）
阅读全文>>2023-01-23 22:35:14
长了芽的红薯能吃吗（红薯不能一起吃的食物有哪些）
阅读全文>>2023-06-05 03:26:13
如何自制一个小抽屉（教你如何制作很大很大的抽屉）
阅读全文>>2022-11-06 13:53:08
梦幻西游手游星辰碎片激活（梦幻西游手游星辰碎片值得囤吗）
阅读全文>>2023-12-31 09:54:51
一个月两份工作怎么找（下班后第二份工作怎么找）
阅读全文>>2022-10-29 04:29:18

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.