基于重复提取一定数量的行？

2024-05-07 23:51:52 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一个dataframe–mydata–包含2000多行，如下所示：

Id  Name    Score
R1  sam       76
R1  Sosan     8
...      ...     ...
R4   jack     2
R4   Tom      76
R4   samy     8
R5   Check    9 
…     ...     ..
R6     Anderson   2
...       ...     ..

现在，我想提取重复次数超过某个数字的ID，例如4。我可以按分组和大小提取唯一数字的大小，如下所示：

Mydata.groupby(by=[‘Id’]).size()

但是，我不能仅根据阈值提取ID

Tags： name id dataframe sam 数字 score jack r5

1条回答

网友

1楼 · 发布于 2024-05-07 23:51:52

您可以尝试使用value_counts计算Id的出现次数，然后根据出现次数过滤结果Series：

num = 2
s = df['Id'].value_counts()
print(s[s>num].index.values)

基于重复提取一定数量的行？

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于重复提取一定数量的行？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >