多层次Pandas群

time account scrip buy_price sell_price qty team 0 06/07/17 09:36 A1 FUT1 50.0 NaN 2 team1 1 06/07/17 09:46 A2 FUT1 100.0 NaN 2 team1 2 06/07/17 09:56 A3 FUT1 10.0 NaN 2 team2 3 06/07/17 09:57 A3 FUT1 NaN 10.0 2 team2 4 06/07/17 09:58 A1 FUT1 NaN 50.0 1 team1 5 06/07/17 09:59 A3 FUT1 NaN 50.0 1 team2

2条回答

网友

1楼 · 编辑于 2024-10-01 00:27:37

您的问题可以通过两个步骤轻松解决：

第一步：

import math
df['some_stuff'] = df.apply(lambda x: -x.qty if math.isnan(x.buy_price) else x.qty,axis=1)

这行代码创建了一个新的列some_stuff，我这样做的目的是在数据中引入gain and loss的一些逻辑。在

如果您不想要一个新的列并且您喜欢这个想法，只需将qty列替换为如下所示：

^{pr2}$

接下来，我使用这个新列创建您的position column，如下所示：

df['position'] = df.groupby(['team','account','scrip'])['some_stuff'].cumsum()

生成此列：

奖金：

如果要删除多余的列some_stuff，只需使用：

del df['some_stuff']

第二步：

在该步骤中，您可以使用以下行获取最终分组表：

print(df.groupby(['team', 'account', 'scrip']).min())

最终输出：

                               time  buy_price  sell_price  qty  position
team  account scrip                                                      
team1 A1      FUT1   06/07/17 09:36       50.0        50.0    1         1
      A2      FUT1   06/07/17 09:46      100.0         NaN    2         2
team2 A3      FUT1   06/07/17 09:56       10.0        10.0    1        -1

我相信这能回答你的问题。在

文档：

pandas.DataFrame.apply

pandas.Groupby

pandas.DataFrame.cumsum

pandas.DataFrame.min

网友

2楼 · 编辑于 2024-10-01 00:27:37

这就是你要找的吗？在

df.groupby(['team', 'account', 'scrip']).min()

它给了我：

^{pr2}$

这比您想要的多了几列，但是您可以将所要查找的列子集化。在

（默认情况下，groupby会将分组的列移动到多级索引中，但如果您不希望这样做，您可以在.groupby()中添加{}作为参数）

相关问题更多 >

编程相关推荐

热门问题

热门文章