如何以合理快速的方式从“山道小车”达到许多次目标 (>1000) 制作视频

2024-10-01 15:48:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我想做一个视频从山地车达到目标(旗子位置>;.5)多次。我使用的是openai的MountainCar-v0(有步骤和奖励限制的变化),但是要达到这个目标需要很多时间。 我正在使用以下代码:

import numpy as np
import gym

from gym import wrappers    
gym.envs.register(
    id='MountainCarMyVersion-v0',
    entry_point='gym.envs.classic_control:MountainCarEnv',
    max_episode_steps=200000,      # MountainCar-v0 uses 200
    reward_threshold=-1000.0,
)
env = gym.make('MountainCarMyVersion-v0')

env = wrappers.Monitor(env, '/home/video', force=True)
game_terminator = 0
for i_episode in range(2000):
    time.sleep(2)
    for t in range(1000000):
        if game_terminator:
            break
        env.render()
        action = env.action_space.sample()
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t + 1))
            observation = env.reset()
            if t < 200000 - 1 and reward > -1:
                print('the flag point is reched at step:', t)
                game_terminator = 1
                break

如何更改此设置以帮助代理更快地达到目标? 谢谢


Tags: importenvgameifactionpointwrappersgym

热门问题