OpenAI健身房环境为各种复杂的难题
rubiks-cube-gym的Python项目详细描述
鲁比克斯库贝吉
一个开放式的健身房环境,可以解决各种各样的难题。
当前可用的环境:
- [x] 2x2x2袖珍魔方
- [x] 吡拉明
- [x] 斜纹
详细信息:
2x2x2袖珍魔方
| | |
|--|--|
|动作空间|离散(3)|
|观测空间|离散(3674160)|
|行动| F,R,U |
|奖励|(-inf,100]|
|最大步数| 250|
|奖励类型|基础、逐层方法、奥尔特加方法|
|渲染模式|“人类”、“rgb_数组”、“ansi”|
不带尖端的吡拉明
| | |
|--|--|
|动作空间|离散(4)|
|观测空间|离散(933120)|
|行动| L、R、U、B |
|奖励|(-inf,100]|
|最大步数| 250|
|124层奖励方式|
|渲染模式|“人类”、“rgb_数组”、“ansi”|
斜交b
| | |
|--|--|
|动作空间|离散(4)|
|观测空间|离散(3149280)|
|行动| L、R、U、B |
|奖励|(-inf,100]|
|最大步数| 250|
|奖励类型|基础,莎拉方法(高级)|
|渲染模式|“人类”、“rgb_数组”、“ansi”|
安装
通过PyPI
pip install rubiks-cube-gym
或从源代码构建
^{pr2}$要求
- 健身房
- numpy公司
- opencv python
- wget公司
争先恐后
您可以将加扰作为重置函数的参数传递
self.reset(scramble="R U R' U'")
加扰应该在WCA Notation之后
示例
import gym
import rubiks_cube_gym
env = gym.make('rubiks-cube-222-lbl-v0')
env.reset(scramble="R U R' U' R' F R2 U' R' U' R U R' F'")
for _ in range(4):
env.render()
print(env.step(1))
env.render(render_time=0)
env.close()
(3178426, -26, False, {'cube': array([ 0, 9, 2, 15, 4, 5, 6, 21, 16, 10, 1, 11, 12, 13, 14, 23, 17, 7, 3, 19, 20, 18, 22, 8], dtype=uint8), 'cube_reduced': 'WRWGOOGYRBWBOOGYRGWBYBYR'})
(1542962, -1, False, {'cube': array([ 0, 21, 2, 23, 4, 5, 6, 18, 17, 16, 15, 11, 12, 13, 14, 8, 7, 10, 9, 19, 20, 3, 22, 1], dtype=uint8), 'cube_reduced': 'WYWYOOGBRRGBOOGRGBRBYWYW'})
(1682970, -1, False, {'cube': array([ 0, 18, 2, 8, 4, 5, 6, 3, 7, 17, 23, 11, 12, 13, 14, 1, 10, 16, 21, 19, 20, 9, 22, 15], dtype=uint8), 'cube_reduced': 'WBWROOGWGRYBOOGWBRYBYRYG'})
(2220193, 25, False, {'cube': array([ 0, 3, 2, 1, 4, 5, 6, 9, 10, 7, 8, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23], dtype=uint8), 'cube_reduced': 'WWWWOOGRBGRBOOGGRRBBYYYY'})
- 项目
标签: