从pandas数据fram中选择排序组的第一行

campaignname category_type amount A cat_A_0 2.0 A cat_A_1 1.0 A cat_A_2 3.0 A cat_A_2 3.0 A cat_A_2 4.0 B cat_B_0 3.0 C cat_C_0 1.0 C cat_C_1 2.0

for name, gp in df.groupby('campaignname'): sorted_gp = gp.groupby(['campaignname', 'category_type']).sum().sort_values(['amount'], ascending=False) # I'd like to know how to select this in a cleaner/more concise way first_row = [sorted_gp.iloc[0].name[0], sorted_gp.iloc[0].name[1], sorted_gp.iloc[0].values.tolist()[0]]

2条回答

网友

1楼 · 编辑于 2024-05-19 14:31:28

你可以这样做：

In [83]: df.groupby('campaignname', as_index=False) \
           .apply(lambda x: x.nlargest(1, columns=['amount'])) \
           .reset_index(level=1, drop=1)
Out[83]:
  campaignname category_type  amount
0            A       cat_A_2     4.0
1            B       cat_B_0     3.0
2            C       cat_C_1     2.0

或：

In [76]: df.sort_values('amount', ascending=False).groupby('campaignname').head(1)
Out[76]:
  campaignname category_type  amount
4            A       cat_A_2     4.0
5            B       cat_B_0     3.0
7            C       cat_C_1     2.0

网友

2楼 · 编辑于 2024-05-19 14:31:28

我更喜欢的方法是使用idxmax。它返回最大值的索引。我随后使用该索引对df进行切片

df.loc[df.groupby('campaignname').amount.idxmax()]

  campaignname category_type  amount
4            A       cat_A_2     4.0
5            B       cat_B_0     3.0
7            C       cat_C_1     2.0

相关问题更多 >

编程相关推荐

热门问题

热门文章