我的数据集(ppf)如下所示:
我希望每个赛季每个球员的得分和篮板都有所不同,然后在赛季结束时让球员和赛季回归
期望输出:
我将球员ID和赛季列名称存储在标识符中,统计名称存储在cumstats_cols中。我尝试了以下方法:
ppfs = ppf[identifiers + cumstats_cols].sort_values(['playerid','season']).groupby(['playerid'])[cumstats_cols].diff().reset_index()
但我无法判断它是否正常工作,因为它不会返回球员ID和赛季以及差异
谢谢你的帮助
编辑 我希望保留原始表,而是将差异存储在其他列中
让我们试试:
输出:
使用:
相关问题 更多 >
编程相关推荐