如何为滚动函数python构建和应用自定义函数?

2024-05-05 16:28:12 发布

您现在位置:Python中文网/ 问答频道 /正文

如何构建一个自定义函数来应用于df.rolling().apply(func),该函数获取滚动窗口周期中的第一行或最后一行,并对其进行处理

假设我有这个df

Customer #    #1     #2     #3
0             15     42     56    
1             16     36     15    
2             14     69     96    
3             16     89     33    
4             12     98     68
...
1510           9     59     46

其中,列值为每个客户在连续0-1510天内的支出。对于每个滚动窗口期(假设63),我如何才能得到每个周期的最后一行,并从所有3个客户中得到每个客户在滚动窗口期最后一天花费的资金比例,以便计算总标准偏差(公式=权重。T*cov_矩阵*权重)?我知道我可以做df.rolling().mean()来获得滚动窗口的支出平均值,或者df.rolling().cov()来生成每个rw的协方差矩阵,但不确定如何仅获取最后一行来获得权重