我有一个dataframe–mydata–包含2000多行,如下所示:
Id Name Score
R1 sam 76
R1 Sosan 8
... ... ...
R4 jack 2
R4 Tom 76
R4 samy 8
R5 Check 9
… ... ..
R6 Anderson 2
... ... ..
现在,我想提取重复次数超过某个数字的ID,例如4。我可以按分组和大小提取唯一数字的大小,如下所示:
Mydata.groupby(by=[‘Id’]).size()
但是,我不能仅根据阈值提取ID
Tags:
您可以尝试使用
value_counts
计算Id
的出现次数,然后根据出现次数过滤结果Series
:相关问题 更多 >
编程相关推荐