<p>我目前正在阅读Sudharsan Ravichandiran的《用Python进行强化学习的实践》(Hands On Reinforcement Learning with Python)</I>,以及我遇到的第一个AttributeError示例之一:</p>
<p><code>AttributeError 'TimeLimit' object has no attribute 'P'</code></p>
<p>由以下行引发:</p>
<pre><code>for next_sr in env.P[state][action]:
</code></pre>
<p>我找不到任何关于<I>env.p</I>的文档,但是我在这里找到了一个用python2编写的类似示例:<a href="https://gym.openai.com/evaluations/eval_48sirBRSRAapMjotYzjb6w/" rel="nofollow noreferrer">https://gym.openai.com/evaluations/eval_48sirBRSRAapMjotYzjb6w/</a></p>
<p>我想,<I>env.p</I>是一个过时的图书馆的一部分(即使这本书是在2018年6月出版的,而被指控的代码是python3),那么我该如何替换它呢?在</p>