gym模块如何安装,windows能安装gym吗

首页 > 实用技巧 > 作者：YD1662024-01-02 22:09:04

，动作空间为

gym模块如何安装,windows能安装gym吗(9)

，当动作为1时，施加正向的力10N;当动作为0时，施加负向的力-10N。

因为动作空间是离散的，因此我们设计随机策略为softmax策略。Softmax策略如何构建，以及如何构建损失函数，从而将强化学习问题变成一个优化问题。

2.3 soft策略及其损失函数

我们设计一个前向神经网络策略，如图2.3所示。

gym模块如何安装,windows能安装gym吗(10)

图2.3 softmax策略

该神经softmax策略的输入层是小车倒立摆的状态，维数为4；最后一层是softmax层，维数为2。有机器学习的同学都很清楚，softmax常常作为多分类器的最后一层。

一个最基本的概念是何为softmax层？

如图2.3，设layer2的输出为z, 所谓softmax层是指对z作用一个softmax函数。即：

gym模块如何安装,windows能安装gym吗(11)

对于softmax策略，策略梯度理论中的随机策略为：

gym模块如何安装,windows能安装gym吗(12)

上一页 1 234 5 下一页

栏目热文

gym包安装视频教程（windows能安装gym吗）
阅读全文>>2024-01-02 22:11:52
查看gym版本（gym all 安装出错）
阅读全文>>2024-01-02 22:54:18
gym怎么打开（下载gym环境）
阅读全文>>2024-01-02 22:09:52
gym库的基本使用方法（gym库配置要求）
阅读全文>>2024-01-02 22:49:07
使命召唤战区画面a卡最佳设置（使命召唤战区怎样设置画面流畅）
阅读全文>>2024-01-02 22:51:39
gym 可以在windows使用吗（win7中如何安装gym）
阅读全文>>2024-01-02 22:50:44
gym使用教程（gym课程教学）
阅读全文>>2024-01-02 22:53:36
洛克王国游戏币怎么弄最快（洛克王国游戏币如何快速得）
阅读全文>>2024-01-02 22:52:03
洛克王国金币怎么快速得（洛克王国现在怎么赚金币）
阅读全文>>2024-01-02 22:29:46
洛克王国快速赚金币（洛克王国怎么赚rmb）
阅读全文>>2024-01-02 22:24:05

文档排行

本站推荐

侧面怎么拍建筑物（怎么拍建筑物才好看）
阅读全文>>2023-10-25 15:41:57
信用社算国企吗（信用社和国企哪个好）
阅读全文>>2023-01-23 22:35:14
长了芽的红薯能吃吗（红薯不能一起吃的食物有哪些）
阅读全文>>2023-06-05 03:26:13
如何自制一个小抽屉（教你如何制作很大很大的抽屉）
阅读全文>>2022-11-06 13:53:08
梦幻西游手游星辰碎片激活（梦幻西游手游星辰碎片值得囤吗）
阅读全文>>2023-12-31 09:54:51
一个月两份工作怎么找（下班后第二份工作怎么找）
阅读全文>>2022-10-29 04:29:18

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.