Pandas:计算datafram中重复项的平均值

2024-05-19 16:25:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在使用python和pandas中的一个dataframe,它在第一列中包含重复的条目。数据帧如下所示:

    sample_id    qual    percent
0   sample_1      10        20
1   sample_2      20        30
2   sample_1      50        60
3   sample_2      10        90
4   sample_3      100       20

我想写一些东西来识别第一列中的重复条目,并计算后续列的平均值。理想的输出类似于以下内容:

    sample_id    qual    percent
0   sample_1      30        40
1   sample_2      15        60
2   sample_3      100       20

我整个下午都在努力解决这个问题,希望能得到帮助。


Tags: 数据sampleiddataframepandas条目平均值percent
2条回答

groupby列并使用mean

df.groupby('sample_id').mean().reset_index()

df.groupby('sample_id', as_index=False).mean()

抓住你

enter image description here

Groupby会起作用的。

data.groupby('sample_id').mean()

然后可以使用reset_index()使外观完全符合您的要求。

相关问题 更多 >