Pandas使用groupby累积部分元素的总和

CustID Date OrderNum LotNum PtsPerLot A123 1/1/2015 1234 A 2 A123 1/1/2015 1234 B 10 A123 1/1/2015 5678 A 7

3条回答

网友
1楼 · 编辑于 2024-10-01 09:33:15

要进入问题的第一部分，PtsPerOrder，您需要一个转换。sum是一个聚合。所以使用.transform：
In [10]: df Out[10]: Date OrderNum LotNum PtsPerLot CustID A123 1/1/2015 1234 A 2 A123 1/1/2015 1234 B 10 A123 1/1/2015 5678 A 7 In [11]: df.groupby('OrderNum')['PtsPerLot'].transform('sum') Out[11]: CustID A123 12 A123 12 A123 7 dtype: int64
然后用它来创建一个新的列。。。在
^{pr2}$
我还是没去查你的CumPtsPerYear规格。。。在

网友
2楼 · 编辑于 2024-10-01 09:33:15

首先，计算PtsPerOrder。使用transform沿数据帧的实际索引广播每组的计算结果：
df['PtsPerOrder'] = df.groupby('OrderNum')['PtsPerLot'].transform(sum)
然后取每个组中新列的第一个元素：
^{pr2}$
通过执行要搜索的累计和结束计算。它将跳过NA值。使用前向填充完成数据帧：
df['CumPtsPerYear'].cumsum().ffill() 0 12.0 1 12.0 2 19.0

网友
3楼 · 编辑于 2024-10-01 09:33:15

首先需要使用transformation：

df['*PtsPerOrder*'] = df.groupby('OrderNum')['PtsPerLot'].transform(sum)

然后为了创建另一个，我没有找到另一种方法来找到每个组的最大值，对其进行累计，然后将其合并到：

^{pr2}$
结果如预期：
CustID Date OrderNum LotNum PtsPerLot *PtsPerOrder* *CumPtsPerYear* 0 A123 2015-01-01 1234 A 2 12 12 1 A123 2015-01-01 1234 B 10 12 12 2 A123 2015-01-01 5678 A 7 7 19

相关问题更多 >

编程相关推荐

热门问题

热门文章