我有一个数据框,例如:
groups ids numbers
group3 id4 89
group1 id1 50
group1 id1 30
group1 id2 90
group2 id4 89
group2 id6 76
group3 id4 90
它的思想是用groupby
分组找到重复的id,并通过分组得到只包含重复id的新数据帧,例如:
group1 id1 50
group1 id1 30
group3 id4 89
group3 id4 90
我试过:
for groups in df.groupby('groups'):
print(df['ids'].duplicated)
谢谢你的帮助
函数} by multiple columns和参数} 过滤:
groupby
不是必需的,为了获得更好的性能,使用^{keep=False
获取所有重复,然后按^{如果需要排序,添加^{} 和^{} 作为默认索引:
您可以使用:
输出:
相关问题 更多 >
编程相关推荐