按一列分组，并在pandas中查找另一列的sum和max值

Name id col1 col2 col3 cl4 PL 252 0 747 3 53 PL2 252 1 24 2 35 PL3 252 4 75 24 13 AD 889 53 24 0 95 AD2 889 23 2 0 13 AD3 889 0 24 3 6 BG 024 12 89 53 66 BG1 024 43 16 13 0 BG2 024 5 32 101 4

Name id col1 col1(sum) col2 col2(max) col3 col(max) col4 col4(sum) PL 252 0 5 747 747 3 24 6 18 PL2 252 1 5 24 747 2 24 12 18 PL3 252 4 5 75 747 24 24 0 18 AD 889 53 76 24 24 95 95 23 33 AD2 889 23 76 2 24 13 95 5 33 AD3 889 0 76 24 24 6 95 5 33 BG 024 12 60 89 89 66 66 0 67 BG1 024 43 60 16 89 0 66 63 67 BG2 024 5 60 32 89 4 66 4 67

3条回答

网友

1楼 · 编辑于 2024-09-29 19:08:17

当id上有groupby和sum时，可以使用merge：

pd.merge(df,df.groupby("id").sum().reset_index(), on='id',how='outer')

输出

网友

2楼 · 编辑于 2024-09-29 19:08:17

可以使用groupby/transform创建所需的列

df[['col1_sum', 'col4_sum']]=df.groupby('id')['col1', 'cl4'].transform('sum')
df[['col2_max', 'col3_max']]=df.groupby('id')['col1', 'cl4'].transform('max')

    Name    id  col1    col2    col3    cl4 col1_sum    col4_sum    col2_max    col3_max
0   PL      252 0       747     3       53  5           101         4   53
1   PL2     252 1       24      2       35  5           101         4   53
2   PL3     252 4       75      24      13  5           101         4   53
3   AD      889 53      24      0       95  76          114         53  95
4   AD2     889 23      2       0       13  76          114         53  95
5   AD3     889 0       24      3       6   76          114         53  95
6   BG      24  12      89      53      66  60          70          43  66
7   BG1     24  43      16      13      0   60          70          43  66
8   BG2     24  5       32      101     4   60          70          43  66

网友

3楼 · 编辑于 2024-09-29 19:08:17

最（pandas）的本地方法是使用^{}方法，该方法允许您指定要应用于每列的聚合函数（就像在SQL中一样）。

文件样本：

df.groupby('A').agg({'B': ['min', 'max'], 'C': 'sum'})

相关问题更多 >

编程相关推荐

热门问题

热门文章