这是我的代码:
frst_df = df.drop(columns=["Comment"]).groupby(['source'], as_index=False).agg('first')
cmnt_df = df.groupby(['source'], as_index=False)['Comment'].apply(', '.join)
merge_df = pd.merge(frst_df, cmnt_df , on='source')
我希望我在这里所做的一切是可以理解的
我有一个很大的数据框,其中有一列“source”。这是数据帧的主列。现在对于“Comment”列,我想加入与“source”值对应的所有注释。数据框中还有大约50个其他列。我只想从与“源”对应的所有值中选取第一个元素
我编写的代码工作得很好,但是数据帧非常庞大,创建两个单独的数据帧然后合并它们需要很多时间。有没有更好的办法
这是另一种可能的解决办法
您可以使用^{} by dictionary-所有列仅通过
Comment
byjoin
聚合:相关问题 更多 >
编程相关推荐