在数据帧中对一列求和，同时保留其他列

NAME KEYWORD AMOUNT INFO 0 orange fruit 13 from italy 1 potato veggie 7 from germany 2 potato veggie 9 from germany 3 orange fruit 8 from italy 4 potato veggie 6 from germany

2条回答

网友

1楼 · 编辑于 2024-10-03 04:25:58

对自定义aggfunc dict使用^{}+^{}

f = dict.fromkeys(df.columns.difference(['KEYWORD']), 'first')
f['AMOUNT'] = sum

df = df.groupby('KEYWORD', as_index=False).agg(f)
df

  KEYWORD    NAME  AMOUNT          INFO
0   fruit  orange      21    from italy
1  veggie  potato      22  from germany

dict.fromkeys给了我一个很好的方法来推广N个列。如果列顺序很重要，请在末尾添加^{}操作：

df = df.groupby('KEYWORD', as_index=False).agg(f).reindex(columns=df.columns)
df

     NAME KEYWORD  AMOUNT          INFO
0  orange   fruit      21    from italy
1  potato  veggie      22  from germany

网友

2楼 · 编辑于 2024-10-03 04:25:58

按列KEYWORD使用^{}，然后^{}聚合值：

df=df.drop_duplicates('KEYWORD').assign(AMOUNT=df.groupby('KEYWORD')['AMOUNT'].sum().values)
print (df)
     NAME KEYWORD  AMOUNT          INFO
0  orange   fruit      21    from italy
1  potato  veggie      22  from germany

相关问题更多 >

编程相关推荐

热门问题

热门文章

在数据帧中对一列求和，同时保留其他列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >