对于强化学习模型的实施,培训和评估的奖励制度是否会有所不同?

2024-09-27 19:27:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图创建一个强化学习模型,用于基于公司财务状况对公司进行估值。在评估中,我将使用财务趋势来奖励代理人。在培训期间,我想奖励实际股价上涨的员工,比如说,在季度末提高估值(又名股价)。我可以这样做吗?i、 e.培训和评估是否有单独的奖励制度


Tags: 模型员工公司又名趋势财务财务状况代理人

热门问题