我的问题是我想预测一支球队对另一支球队的胜利,我想在比赛开始前预测每场比赛的胜率
但是,使用df.groupBy("teamName").agg({"isVictory":"mean"})
为我提供了团队的全局wirate,这是不可用的,因为此时不应该知道所有匹配的winrate
所以我想要的是,在这个匹配之前获得匹配的winrate,知道我的DataFrame中有一列index
,它保持了匹配的顺序(即,如果匹配的索引低于当前匹配的索引,则意味着之前已经进行了匹配,因此应该在平均值中考虑此匹配)
请注意,我的列是:
indexMatch, nameTeam, isVictoryTeam
(isVictoryTeam=如果团队1获胜,如果团队失败,则为0)
数据集示例:
IndexMatch isVictoryTeam team winrate
0 1 1 a NaN
1 2 0 a 1
2 3 1 a 0.5
3 4 1 a 0.6667
winrate是预期的输出。
事先谢谢你的帮助
一定有更好的方法,但这一种有效:
相关问题 更多 >
编程相关推荐