如何使用滚动总计构建Python函数？

df3 = df1.merge(df2, how='outer', left_on=['date', 'code'], right_on=['date', 'code']).fillna(0) df3['qty1'] = df3['qty_x'] - df3['qty_y'] df3['qty'] = 0 def final_adder(x): x.qty_x = x.qty_x print(x) return x df_final = df3.groupby(['code']).apply(final_adder) df_final['qty'] = df_final['qty'].clip(lower=0) df_final.drop(['qty_x', 'qty_y','qty1'], inplace=True, axis=1) date code qty_x qty_y qty1 qty 0 10/01/2019 A 20.0 0.0 20.0 0 3 11/01/2019 A 2.0 5.0 -3.0 0 7 12/01/2019 A 4.0 100.0 -96.0 0 11 13/01/2019 A 10.0 0.0 10.0 0

s = """ Date Code Quantity 0 10/01/2019 A 20 3 11/01/2019 A 17 7 12/01/2019 A 0 11 13/01/2019 A 10 12 14/01/2019 A 10 15 15/01/2019 A 9 16 16/01/2019 A 7 """

1条回答

网友
1楼 · 发布于 2024-07-08 11:08:58

关于SO的问题有一个完整的子类型，涉及带限制的累积运算（例如：“当累积和变为负数时重置为零”）。这与具有已知重置点的累积操作（例如，来自另一列或存在NaN等）不同，因为该条件涉及累积值本身
在当前的熊猫或numpy中，没有干净的方法以矢量化的方式实现这一点
我所知道的最好（最快）的方法是this SO answer涉及numba。根据您的问题稍作修改和调整：
from numba import njit @njit def poscumsum(x): total = 0 result = np.empty(x.shape) for i, y in enumerate(x): total += y if total < 0: total = 0 result[i] = total return result
使用此功能，您可以执行以下操作：
a = df1.set_index(['Code', 'Date']) b = df2.set_index(['Code', 'Date']) idx = a.index.union(b.index).sort_values() df3 = (a.reindex(idx, fill_value=0) - b.reindex(idx, fill_value=0)) # optional: resample Date to daily within each group: df3 = df3.groupby('Code').resample('D', level='Date').sum() df3['Quantity'] = df3.groupby('Code')['Quantity'].transform( lambda g: poscumsum(g.values))
关于问题中提供的数据：
>>> df3 Quantity Code Date A 2019-01-10 20 2019-01-11 17 2019-01-12 0 2019-01-13 10 2019-01-14 10 2019-01-15 9 2019-01-16 7
如果愿意，还可以使用“合并”。以下是保存所有中间结果的示例（用于法医分析）：
df3 = df1.merge(df2, on=['Code', 'Date'], how='outer', sort=True).fillna(0) # optional: resample Date to daily within each group: df3 = df3.set_index(['Code', 'Date']).groupby('Code').resample('D', level='Date').sum() df3['diff'] = df3['Quantity_x'] - df3['Quantity_y'] df3['cumdiff'] = df3.groupby('Code')['diff'].transform( lambda g: poscumsum(g.values)) df3 # out: Quantity_x Quantity_y diff cumdiff Code Date A 2019-01-10 20.0 0.0 20.0 20.0 2019-01-11 2.0 5.0 -3.0 17.0 2019-01-12 4.0 100.0 -96.0 0.0 2019-01-13 10.0 0.0 10.0 10.0 2019-01-14 0.0 0.0 0.0 10.0 2019-01-15 0.0 1.0 -1.0 9.0 2019-01-16 0.0 2.0 -2.0 7.0

相关问题更多 >

编程相关推荐

热门问题

热门文章