为什么我的深Q网和双深Q网不稳定?我正在尝试实现DQN和DDQN(都有经验回复)来解决OpenAI AI健身房的Cartpole环境。这两种方法有时都能学习和解决这个问题,但并不总是如此。在 我的网络只是一个前馈网络(我试过使用1层和 ...2024-10-01 已阅读: n次