OpenAI健身房环境为各种复杂的难题

rubiks-cube-gym的Python项目详细描述


鲁比克斯库贝吉

一个开放式的健身房环境,可以解决各种各样的难题。

GitHub Workflow StatusPyPIPyPI - WheelPyPI - LicensePyPI - Downloads

当前可用的环境:

  • [x] 2x2x2袖珍魔方
  • [x] 吡拉明
  • [x] 斜纹

详细信息:

2x2x2袖珍魔方

Mapping of tiles | | | |--|--| |动作空间|离散(3)| |观测空间|离散(3674160)| |行动| F,R,U |
|奖励|(-inf,100]| |最大步数| 250| |奖励类型|基础、逐层方法、奥尔特加方法| |渲染模式|“人类”、“rgb_数组”、“ansi”|

不带尖端的吡拉明

Mapping of tiles | | | |--|--| |动作空间|离散(4)| |观测空间|离散(933120)| |行动| L、R、U、B |
|奖励|(-inf,100]| |最大步数| 250| |124层奖励方式| |渲染模式|“人类”、“rgb_数组”、“ansi”|

斜交b

Mapping of tiles | | | |--|--| |动作空间|离散(4)| |观测空间|离散(3149280)| |行动| L、R、U、B |
|奖励|(-inf,100]| |最大步数| 250| |奖励类型|基础,莎拉方法(高级)| |渲染模式|“人类”、“rgb_数组”、“ansi”|

安装

通过PyPI

pip install rubiks-cube-gym

或从源代码构建

^{pr2}$

要求

  • 健身房
  • numpy公司
  • opencv python
  • wget公司

争先恐后

您可以将加扰作为重置函数的参数传递 self.reset(scramble="R U R' U'")

加扰应该在WCA Notation之后

示例

import gym  
import rubiks_cube_gym  

env = gym.make('rubiks-cube-222-lbl-v0')  
env.reset(scramble="R U R' U' R' F R2 U' R' U' R U R' F'")  

for _ in range(4):  
    env.render()  
    print(env.step(1))  
env.render(render_time=0)  
env.close()
(3178426, -26, False, {'cube': array([ 0,  9,  2, 15,  4,  5,  6, 21, 16, 10,  1, 11, 12, 13, 14, 23, 17, 7,  3, 19, 20, 18, 22,  8], dtype=uint8), 'cube_reduced': 'WRWGOOGYRBWBOOGYRGWBYBYR'})
(1542962, -1, False, {'cube': array([ 0, 21,  2, 23,  4,  5,  6, 18, 17, 16, 15, 11, 12, 13, 14,  8,  7, 10,  9, 19, 20,  3, 22,  1], dtype=uint8), 'cube_reduced': 'WYWYOOGBRRGBOOGRGBRBYWYW'})
(1682970, -1, False, {'cube': array([ 0, 18,  2,  8,  4,  5,  6,  3,  7, 17, 23, 11, 12, 13, 14,  1, 10, 16, 21, 19, 20,  9, 22, 15], dtype=uint8), 'cube_reduced': 'WBWROOGWGRYBOOGWBRYBYRYG'})
(2220193, 25, False, {'cube': array([ 0,  3,  2,  1,  4,  5,  6,  9, 10,  7,  8, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23], dtype=uint8), 'cube_reduced': 'WWWWOOGRBGRBOOGGRRBBYYYY'})

Output

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JNI和取消异步任务   java整数n作为List<String>的第二个参数传递。子列表(fromIndex,toIndex),但是stacktrace说toIndex在Kotlin中是n+2   如何在Java中正确嵌套多个ArrayList/Maps?   在嵌套条件语句中比较数组中的值时,java List没有打印正确的值   从CRON作业运行java代码   JRE使用jvisualvm检测到java致命错误   java将字符添加到BufferedReader中   带有枚举的java单例与带有双重检查锁定的单例   Java中的编译器构造基类的更改会影响子类的字节码吗?   Java作为Windows服务用户数据路径   java clone():ArrayList。克隆人()我认为它是一个肤浅的复制品   在jfilechooser多文件选择器启用中打开对话框后,java文件将显示所选文件   java在常用的操作方法中使用反射可以吗?   java ReloadableResourceBundleMessageSource。getMessage()不使用我给它的参数