删除所有与pandas datafram中出现次数少于N个索引匹配的值

item_id measure1 measure2 ... 1 someNumber someNumber 1 someNumber someNumber 1 someNumber someNumber 2 someNumber someNumber 3 someNumber someNumber 3 someNumber someNumber 4 someNumber someNumber 5 someNumber someNumber 5 someNumber someNumber

1条回答

网友

1楼 · 发布于 2024-09-30 16:24:04

您可以使用groupby和filter：

>>> df.groupby("item_id").filter(lambda x: len(x) > 1)
   item_id    measure1    measure2
0        1  someNumber  someNumber
1        1  someNumber  someNumber
2        1  someNumber  someNumber
4        3  someNumber  someNumber
5        3  someNumber  someNumber
7        5  someNumber  someNumber
8        5  someNumber  someNumber

事实上，这与the docs中的一个例子非常相似。在

请注意，在评论中进行了一些讨论之后，很明显，在某些情况下，这在0.12中似乎不起作用，但在当前主干中有效。我相信这是jreback在this commit中修复的，如果我读取的是过滤器结果类型的正确分支，那么就避免了困难。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

删除所有与pandas datafram中出现次数少于N个索引匹配的值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >