用于定义导航网格世界的轻量级库
navigation-mdp的Python项目详细描述
导航MDP
用于指定导航mdp的简单Python3接口。旨在提供更自然的语法来指定MDP,同时还提供实验所需的一些扩展性。在
马尔可夫决策
MDP由states S、dynamics T、actions A和rewards R定义。这个库的设计理念是MDP中的每个实体都是一个单独的对象。国家是中心实体。其他所有内容都是可选的,可以根据需要定义并附加到状态。在
安装
要使用pip安装当前版本:
pip install navigation-mdp
从源安装:
^{pr2}$使用
如果你好奇它能做什么:
1。查看笔记本中的示例
2。在Google Colab
3。在MyBinder上玩
依赖关系
对于可视化效果:https://github.com/yrevar/navigation_vis
致谢
- 感谢Michael Littman、Lucas Lehnert和David Abel的所有讨论,这些讨论对开发概念非常有帮助。在
- State类的灵感来自davidabel的简单RL框架:https://github.com/david-abel/simple_rl
- 项目
标签: