Tensorflow 2.0 DQN行动规范屏蔽

2024-07-02 04:23:19 发布

男 | 程序猿一只，喜欢编程写python代码。

我已经使用Tensorflow为DQN代理创建了一个自定义环境，无论我多么希望根据观察规范的状态修改操作规范

我的动作规范是 self.\u action\u spec=array\u spec.BoundedArraySpec（shape=（），dtype=np.int32，最小值=0，最大值=3，name='action'）因为我有4个可能的动作。（0,1,2,3）但是，根据观察规范状态/信息，我希望也只允许操作0和3作为下一个操作

我希望有一种方法可以在我的环境中添加这个，而不是使用观察和约束拆分器。但是我不知道如何重新定义自我。_action_spec也只允许操作0和3

0条回答

目前没有回答

编程相关推荐

java为什么datanode没有运行？
swing Java：语法突出显示组件keyevents
java swing计时器是如何工作的？
java jdatechooser作为mysql查询中的参数
java为不同的EJB名称创建相同的无状态EJB bean类，而不复制EJB bean类
Java：在嵌套的静态类中引用外部类
java SimpleMessageListener与DirectMessageListener
java如何在WildFly上禁用WELD
java Selenium在属性文件或excel工作表中保存XPath的最佳方法是什么
Jetty下Spring MVC应用程序中的java ServletContext

热门问题

当pandas中出现小数据时，DataFrame.resample()被调用时，内存不足
7 个回答
当Pandas中存在许多条件时，如何过滤数据？
8 个回答
当pandas中没有公共列名时，我们应该如何组合多个数据集而不在行或列中重复
3 个回答
当pandas中的值为null时，不使用pandas的to_列表
3 个回答
当Pandas中的值和条目匹配时，如何计算键的计数？
11 个回答
当pandas列中有字符串时，如何从该列获取最长长度的string/integer/float
3 个回答
当pandas列重命名创建列名重复时该怎么办
1 个回答
当Pandas在带有颜色标签的多个子图中创建散点图时，无法设置xlabel
1 个回答
当pandas导入openpyxl模块时，该模块没有属性''uuuversion''
2 个回答
当pandas数据在python中聚合时，如何计算每组尾部的sum | mean |中值
5 个回答
当Pandas数据头以列（如xls）拆分时，如何读取Pandas数据头
9 个回答
当Pandas数据帧包含nan时，用“新信息”更新Pandas数据帧
11 个回答
当pandas是imp时，Cx\u freeze TypeError只能使用numpy依赖项将list（而不是“NoneType”）连接到list
7 个回答
当Pandas满足一定条件时，如何放弃整个群体
2 个回答
当Pandas的时间增量指数不规则时，如何获得时间序列值的日差？
4 个回答
当Pandas通过read\u csv方法读取大文件时。IOError:[Errno 13]权限被拒绝
9 个回答
当panda列有空值时，如何将其转换为int？
1 个回答
当param=''时使用Beautiful Soup访问属性的参数
3 个回答
当paramiko抛出“无现有会话”异常时，标准输入流挂起
2 个回答
当parentchild在同一端口上监听时会发生什么？
7 个回答

Tensorflow 2.0 DQN行动规范屏蔽

相关问题更多 >

编程相关推荐

热门问题

热门文章

Tensorflow 2.0 DQN行动规范屏蔽

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >