马尔可夫决策过程的转移矩阵一定是随机的吗?我试图使用值迭代(通过pymdptoolbox)和NumPy为this diagram中指定的Markov决策过程问题找到最优策略。但是pymdptoolbox说我的转移矩阵“不是随机的”。在 是因为 ...2024-09-30 已阅读: n次