在同一df中,将具有相同索引的df行组合在一起

2024-10-01 00:14:53 发布

您现在位置:Python中文网/ 问答频道 /正文

如果我有一个df看起来像这样:

               v1     v2         ...   v10       v11
id                               ...                            
102717.0   101234650  2018-08-27  ...   NaN       NaN
102717.0   101234650  2018-08-27  ...  UDMS    27/08/2018
102717.0   101234650  2018-08-27  ...   NaN       NaN
102717.0   101234650  2018-08-27  ...  UDMS    27/08/2018

那么,当id col匹配时,如何将这些合并到一行

所需的输出类似于:

               v1     v2         ...   v10       v11
id                               ...                            
102717.0   101234650  2018-08-27  ...  UDMS    27/08/2018

因此,脚本将检查每行中重复的所有值,然后将其减少到任何NaN值


Tags: 脚本iddfcolnanv2v1v10
1条回答
网友
1楼 · 发布于 2024-10-01 00:14:53

这真的取决于你的结果应该是什么样的。例如,v2是否总是包含对应id的相同日期?根据我猜你想做的,我会做以下几点:

mean_dict = dict((el, np.nanmean) for el in df.columns)
newdf = df.groupby('id').agg(mean_dict)

我希望这有帮助。有了关于您的输入和所需输出的更详细信息,我们可能会更好地帮助您

相关问题 更多 >