使用Python3.6、Ubuntu 18.04、Gym 0.15.4、RoS melodic、Tensorflow 1.14和rl_coach 1.01:
我已经建立了一个自定义的健身房环境,使用一个360元素阵列作为观察空间。在
high = np.array([4.5] * 360) #360 degree scan to a max of 4.5 meters
low = np.array([0.0] * 360)
self.observation_space = spaces.Box(low, high, dtype=np.float32)
但是,这还不足以通过ClippedPPO算法正确训练,我想为我的状态添加额外的功能,包括:
世界位置(x,y坐标)
世界方向(四元数:x、y、z、w)
线性轨迹(x、y、z坐标)
角轨迹(x,y,z坐标)。在
我把上面的四个特性组合成了自己的特性np.数组并试图将它们作为状态对象传递回去,但显然它与观测空间不匹配。这个空间。盒子我很困惑。我假设我不能将所有这些特性转储到一个np数组中,因为上界和下界是不同的,但是,我不能确定如何创建一个空格。方框具有多个“特征”的对象。在
TIA公司
请看
gym.spaces.Tuple
类 ref另外,你可以看看我是如何把它用于我自己的ROS envhere
相关问题 更多 >
编程相关推荐