groupby并返回前n个组的所有行

>>> df.head() 0 1 2 3 4 5 6 0 35000 26009 OPTIDX BANKNIFTY XX 1499351400 BANKNIFTY1770621000CE 1 35001 26009 OPTIDX BANKNIFTY XX 1499351400 BANKNIFTY1770621000PE 2 35002 26000 OPTIDX NIFTY XX 1609425000 NIFTY20DEC10400CE 3 35003 26000 OPTIDX NIFTY XX 1609425000 NIFTY20DEC10400PE 4 35004 26009 OPTIDX BANKNIFTY XX 1499956200 BANKNIFTY1771321100CE

>>> k2=k1[k1.groupby(5).ngroup() < 2] Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/opt/python/2.7/lib/python2.7/site-packages/pandas/core/groupby.py", line 529, in __getattr__ (type(self).__name__, attr)) AttributeError: 'DataFrameGroupBy' object has no attribute 'ngroup'

2条回答

网友

1楼 · 编辑于 2024-06-25 06:27:33

如果不能使用ngroup，只需用'dense'对元素进行排序，并使用它来索引df：

In [24]: df.loc[df[5].rank(method='dense') <= 2]
Out[24]: 
       0      1       2          3   4           5                      6
0  35000  26009  OPTIDX  BANKNIFTY  XX  1499351400  BANKNIFTY1770621000CE
1  35001  26009  OPTIDX  BANKNIFTY  XX  1499351400  BANKNIFTY1770621000PE
4  35004  26009  OPTIDX  BANKNIFTY  XX  1499956200  BANKNIFTY1771321100CE

这是因为rank(method='dense')给了我们看到的每个数字的排序等级：

^{pr2}$

（注：在一个奇怪的巧合中，我加了ngroup和{}，所以这个问题让我很高兴。：-）

网友

2楼 · 编辑于 2024-06-25 06:27:33

将^{}（在0.20.2中工作）与^{}一起使用：

df = df.sort_values(5)

print (df.groupby(5).ngroup())
0    0
1    0
4    1
2    2
3    2
dtype: int64

df = df[df.groupby(5).ngroup() < 2]
print (df)
       0      1       2          3   4           5                      6
0  35000  26009  OPTIDX  BANKNIFTY  XX  1499351400  BANKNIFTY1770621000CE
1  35001  26009  OPTIDX  BANKNIFTY  XX  1499351400  BANKNIFTY1770621000PE
4  35004  26009  OPTIDX  BANKNIFTY  XX  1499956200  BANKNIFTY1771321100CE

对于旧版本的pandas，使用一些hack-information隐藏在object grouper.group_info中，因此按[0]选择第一个数组：

^{pr2}$

带^{}的替代解决方案：

df = df.sort_values(5)
df = df[pd.factorize(df[5])[0] < 2]
print (df)
       0      1       2          3   4           5                      6
0  35000  26009  OPTIDX  BANKNIFTY  XX  1499351400  BANKNIFTY1770621000CE
1  35001  26009  OPTIDX  BANKNIFTY  XX  1499351400  BANKNIFTY1770621000PE
4  35004  26009  OPTIDX  BANKNIFTY  XX  1499956200  BANKNIFTY1771321100CE

相关问题更多 >

编程相关推荐

热门问题

热门文章