Groupby在一列上，apply函数在另一列上，但保留dataframe所有其他列的第一个元素

frst_df = df.drop(columns=["Comment"]).groupby(['source'], as_index=False).agg('first') cmnt_df = df.groupby(['source'], as_index=False)['Comment'].apply(', '.join) merge_df = pd.merge(frst_df, cmnt_df , on='source')

2条回答

网友

1楼 · 编辑于 2024-09-24 02:25:02

这是另一种可能的解决办法

df['Comment'] = df.groupby('source')['Comment'].transform(lambda x: ','.join(x))
df = df.groupby('source').first()

网友

2楼 · 编辑于 2024-09-24 02:25:02

您可以使用^{}by dictionary-所有列仅通过Commentby join聚合：

df = pd.DataFrame({
        'Comment':list('abcdef'),
         'B':[4,5,4,5,5,4],
         'C':[7,8,9,4,2,3],
         'D':[1,3,5,7,1,0],
         'E':[5,3,6,9,2,4],
         'source':list('aaabbc')
})

d = dict.fromkeys(df.columns.difference(['source']), 'first')
d['Comment'] = ', '.join

merge_df = df.groupby('source', as_index=False).agg(d)
print (merge_df)
  source  B  C  Comment  D  E
0      a  4  7  a, b, c  1  5
1      b  5  4     d, e  7  9
2      c  4  3        f  0  4

相关问题更多 >

编程相关推荐

热门问题

热门文章

Groupby在一列上，apply函数在另一列上，但保留dataframe所有其他列的第一个元素

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >