如何创建一个多功能的OpenAI健身房观察空间

2024-09-30 20:34:29 发布

您现在位置:Python中文网/ 问答频道 /正文

使用Python3.6、Ubuntu 18.04、Gym 0.15.4、RoS melodic、Tensorflow 1.14和rl_coach 1.01:

我已经建立了一个自定义的健身房环境,使用一个360元素阵列作为观察空间。在

high = np.array([4.5] * 360) #360 degree scan to a max of 4.5 meters
low = np.array([0.0] * 360)
self.observation_space = spaces.Box(low, high, dtype=np.float32)

但是,这还不足以通过ClippedPPO算法正确训练,我想为我的状态添加额外的功能,包括:

世界位置(x,y坐标)
世界方向(四元数:x、y、z、w) 线性轨迹(x、y、z坐标) 角轨迹(x,y,z坐标)。在

我把上面的四个特性组合成了自己的特性np.数组并试图将它们作为状态对象传递回去,但显然它与观测空间不匹配。这个空间。盒子我很困惑。我假设我不能将所有这些特性转储到一个np数组中,因为上界和下界是不同的,但是,我不能确定如何创建一个空格。方框具有多个“特征”的对象。在

TIA公司


Tags: 对象ubuntu状态轨迹np世界空间ros