列出Pandas群中最常见的成员?

2024-10-03 09:11:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含如下列的数据帧:

        id                           lead_sponsor lead_sponsor_class
  02837692    Janssen Research & Development, LLC           Industry
  02837679             Aarhus University Hospital              Other
  02837666  Universidad Autonoma de Ciudad Juarez              Other
  02837653         Universidad Autonoma de Madrid              Other
  02837640         Beirut Eye Specialist Hospital              Other

我想找到最常见的赞助商。我可以使用以下方法列出每组的大小:

^{pr2}$

这给了我这样一个结论:

lead_sponsor                              lead_sponsor_class
307 Hospital of PLA                       Other                  1
3E Therapeutics Corporation               Industry               1
3M                                        Industry               4
4SC AG                                    Industry               8
5 Santé                                   Other                  1

但是我怎么才能找到前10个最常见的群体呢?如果我这样做:

df.groupby(['lead_sponsor', 'lead_sponsor_class']).size().sort_values(ascending=False).head(10) 

然后我得到一个错误:

AttributeError: 'Series' object has no attribute 'sort_values'


Tags: 数据iddesortclassvaluesotherlead
1条回答
网友
1楼 · 发布于 2024-10-03 09:11:33

我想你可以用^{}

print (df.groupby(['lead_sponsor', 'lead_sponsor_class']).size().nlargest(10))

docs中是注释

Faster than .sort_values(ascending=False).head(n) for small n relative to the size of the Series object.

样品:

^{pr2}$

相关问题 更多 >