Pandas数据帧将逻辑应用于列计算

ticker calendar-date last-update Assets Ebitda ..... 0 a 2001-06-30 2001-09-14 110 1000 ..... 1 a 2001-09-30 2002-01-22 0 -8 ..... 2 a 2001-09-30 2002-02-01 0 800 ..... 3 a 2001-12-30 2002-03-06 120 0 ..... 4 b 2001-06-30 2001-09-18 110 0 ..... 5 b 2001-06-30 2001-09-27 110 30 ..... 6 b 2001-09-30 2002-01-08 140 35 ..... 7 b 2001-12-30 2002-03-08 120 40 ..... ..

1条回答

网友

1楼 · 发布于 2024-05-20 18:21:59

第1步
sort_values以确保以后操作的正确顺序

icols = ['ticker', 'calendar-date', 'last-update']
df.sort_values(icols, inplace=True)

第2步
groupby'ticker'和{}零和前向填充

^{pr2}$

注意：第一个'Ebitda'是'b'，因为没有任何东西可以转发填充。在

第3步
groupby['ticker', 'calendar-date']并获取最后一列。因为我们在上面排序，最后一行将是最近更新的行。

d2 = d1.groupby(icols[:2])[vcols].last()

第4步
groupby，这一次只通过'ticker'，它在d2的索引中，取pct_change

d3 = d2.groupby(level='ticker').pct_change()

第5步
join返回df

df.join(d3, on=icols[:2], rsuffix='_pct')

  ticker calendar-date last-update  Assets  Ebitda  Assets_pct  Ebitda_pct
0      a    2001-06-30  2001-09-14     110    1000         NaN         NaN
1      a    2001-09-30  2002-01-22       0      -8    0.000000   -0.200000
2      a    2001-09-30  2002-02-01       0     800    0.000000   -0.200000
3      a    2001-12-30  2002-03-06     120       0    0.090909    0.000000
4      b    2001-06-30  2001-09-18     110       0         NaN         NaN
5      b    2001-06-30  2001-09-27     110      30         NaN         NaN
6      b    2001-09-30  2002-01-08     140      35    0.272727    0.166667
7      b    2001-12-30  2002-03-08     120      40   -0.142857    0.142857

相关问题更多 >

编程相关推荐

热门问题

热门文章