如何选择分组后的前两个值？

df = pd.DataFrame({'State':['TX','TX','TX','LA','LA','LA','LA','MO','MO'], 'County':['TX1','TX1','TX1','LA1','LA1','LA1','LA1','MO1','MO1'], 'value':[1,2,3,1,2,3,4,1,4]})

3条回答

网友

1楼 · 编辑于 2024-06-26 14:32:04

正如你提到的nlargest：

df.groupby(['State', 'County']).value.nlargest(2).reset_index()

网友

2楼 · 编辑于 2024-06-26 14:32:04

不止一种方法可以做到这一点，但我认为选择有序数据的“内置”方法很可能是nth()Docs

import pandas as pd

>>>df
  State County  value
0    TX    TX1      1
1    TX    TX1      2
2    TX    TX1      3
3    LA    LA1      1
4    LA    LA1      2
5    LA    LA1      3
6    LA    LA1      4
7    MO    MO1      1
8    MO    MO1      4

gp = df.sort_values('value', ascending=False).groupby(['State', 'County']).nth([range(2)])

>>>gp
              value
State County
LA    LA1         4
      LA1         3
MO    MO1         4
      MO1         1
TX    TX1         3
      TX1         2

要获取所请求的输出表，请重置其索引

>>>gp.reset_index()
  State County  value
0    LA    LA1      4
1    LA    LA1      3
2    MO    MO1      4
3    MO    MO1      1
4    TX    TX1      3
5    TX    TX1      2

网友

3楼 · 编辑于 2024-06-26 14:32:04

groupbytail之后sort_values

df.sort_values('value').groupby(['State','County']).tail(2)
Out[179]: 
  County State  value
7    MO1    MO      1
1    TX1    TX      2
2    TX1    TX      3
5    LA1    LA      3
6    LA1    LA      4
8    MO1    MO      4

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何选择分组后的前两个值？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >