面向结构化数据推荐的Python深度强化学习工具包。
RL-for-reco的Python项目详细描述
#深度结构化业务学习强化 -在
项目记录 -在
一个向客户推荐产品的类,其中包括客户的当前信息和产品推荐历史记录。 类变量项表示产品及其关联促销、优惠等任何推荐类型。 如果你想要一个客户没有推荐的案例,你可以用“无”来代表这个案例。 状态、行为和奖励分别是n维数组、一维数组和浮点数。 过渡模型state+action=>;(state,reward)假设为TorchModel上的多输出神经网络。在
这个框架实际上适用于任何结构化数据的问题。在
网络记录 -在
通过普通网络更新Q值的类。 这也是对任何问题都适用的一般形式。在
学习 -在
描述一个深度Q学习问题(环境、代理及其策略和相关参数)并通过深度Q网络及其逼近器学习代理的类。在
火炬模型 -在
几个类用pyTorch建立神经网络。在
- 项目
标签: