2024-09-28 21:31:54 发布
网友
我有这样一个数据帧:
org group count org1 1 2 org2 1 2 org3 2 1 org4 3 3 org5 3 3 org6 3 3
这是我想要的,从“组”列的每个唯一组中选择一个条目:
我正在使用以下group by命令,但仍可以看到所有行:
df.groupby('group').head()
有人知道如何得到预期的结果吗?在
你可以在^{上drop_duplicates?在
drop_duplicates
In [172]: df.drop_duplicates('group') Out[172]: org group count 0 org1 1 2 2 org3 2 1 3 org4 3 3
另外,df.drop_duplicates(['group', 'count'])在这种情况下也起作用。在
df.drop_duplicates(['group', 'count'])
然而,这可能不是一个非常灵活的方法。@EdChum的Answer为灵活性提供了方向。在
对groupby对象调用^{},如果要将分组索引作为列返回,则可以选择调用^{}:
groupby
In [448]: df.groupby('group').first().reset_index() Out[448]: group org count 0 1 org1 2 1 2 org3 1 2 3 org4 3
你可以在^{上
drop_duplicates
?在另外,
df.drop_duplicates(['group', 'count'])
在这种情况下也起作用。在然而,这可能不是一个非常灵活的方法。@EdChum的Answer为灵活性提供了方向。在
对} ,如果要将分组索引作为列返回,则可以选择调用^{} :
groupby
对象调用^{相关问题 更多 >
编程相关推荐