我一直在使用python和pandas中的一个dataframe,它在第一列中包含重复的条目。数据帧如下所示:
sample_id qual percent
0 sample_1 10 20
1 sample_2 20 30
2 sample_1 50 60
3 sample_2 10 90
4 sample_3 100 20
我想写一些东西来识别第一列中的重复条目,并计算后续列的平均值。理想的输出类似于以下内容:
sample_id qual percent
0 sample_1 30 40
1 sample_2 15 60
2 sample_3 100 20
我整个下午都在努力解决这个问题,希望能得到帮助。
groupby
列并使用mean
df.groupby('sample_id').mean().reset_index()
或
df.groupby('sample_id', as_index=False).mean()
抓住你
Groupby会起作用的。
然后可以使用
reset_index()
使外观完全符合您的要求。相关问题 更多 >
编程相关推荐