Pandas：计算datafram中重复项的平均值

2024-05-19 16:25:22 发布

男 | 程序猿一只，喜欢编程写python代码。

我一直在使用python和pandas中的一个dataframe，它在第一列中包含重复的条目。数据帧如下所示：

    sample_id    qual    percent
0   sample_1      10        20
1   sample_2      20        30
2   sample_1      50        60
3   sample_2      10        90
4   sample_3      100       20

我想写一些东西来识别第一列中的重复条目，并计算后续列的平均值。理想的输出类似于以下内容：

    sample_id    qual    percent
0   sample_1      30        40
1   sample_2      15        60
2   sample_3      100       20

我整个下午都在努力解决这个问题，希望能得到帮助。

Tags：数据 sample id dataframe pandas 条目平均值 percent

2条回答

网友

1楼 · 编辑于 2024-05-19 16:25:22

groupby列并使用mean

df.groupby('sample_id').mean().reset_index()
或
df.groupby('sample_id', as_index=False).mean()

抓住你

网友

2楼 · 编辑于 2024-05-19 16:25:22

Groupby会起作用的。

data.groupby('sample_id').mean()

然后可以使用reset_index()使外观完全符合您的要求。

Pandas：计算datafram中重复项的平均值

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：计算datafram中重复项的平均值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >