基于数据帧列和创建panda系列

df animal location number 0 lions zoo1 10 1 tigers zoo2 200 2 bears zoo2 300 3 ohmy zoo2 400 4 antelopes zoo1 20 5 orangutans zoo2 500 6 zebras zoo1 30

df.set_index(['location','number'], inplace=True) df.groupby(level=[0,1]).sum().reset_index().sort_values(['location', 'number'], ascending=[1,0]).groupby('location').head(3) location number animal 2 zoo1 30 zebras 1 zoo1 20 antelopes 0 zoo1 10 lions 6 zoo2 500 orangutans 5 zoo2 400 ohmy 4 zoo2 300 bears

df = pd.DataFrame({'animal': ['lions', 'tigers', 'bears', 'ohmy', 'antelopes', 'orangutans','zebras'], 'location': ['zoo1', 'zoo2', 'zoo2', 'zoo2', 'zoo1', 'zoo2', 'zoo1'], 'number': [10, 200, 300, 400, 20, 500, 30]})

2条回答

网友

1楼 · 编辑于 2024-09-30 14:20:45

这可以通过groupby实现：

df.groupby('location')['number'].sum()

将此作为输出返回：

location
zoo1      60
zoo2    1200
Name: number, dtype: int64

网友

2楼 · 编辑于 2024-09-30 14:20:45

使用初始数据帧：

df
       animal location  number
0       lions     zoo1      10
1      tigers     zoo2     200
2       bears     zoo2     300
3        ohmy     zoo2     400
4   antelopes     zoo1      20
5  orangutans     zoo2     500
6      zebras     zoo1      30

使用groupby：

df.groupby('location')['number'].apply(lambda x: x.sort_values(ascending=False).head(3).sum())

输出：

location
zoo1      60
zoo2    1200
Name: number, dtype: int64

相关问题更多 >

编程相关推荐

热门问题

热门文章