Pandas groupby聚合到新列

2条回答

网友

1楼 · 编辑于 2024-10-04 15:22:45

如果安排myfunc返回一个列为['A','B','C','D']且行索引为['min', 'mean', 'max']的数据帧，则可以使用groupby/apply调用函数（每个组一次）并根据需要连接结果：

import numpy as np
import pandas as pd

def myfunc(g):
    result = pd.DataFrame({'min':np.min(g),
                           'mean':np.mean(g),
                           'max':np.max(g)}).T
    return result

df = pd.DataFrame({'A': [1, 1, 1, 1, 2, 2, 3],
 'B': [10, 12, 11, 10, 11, 12, 14],
 'C': [22, 20, 8, 10, 13, 10, 0],
 'D': [14, 37, 18, 6, 4, 12, 5]})

result = df.groupby('A')[['B','C']].apply(myfunc)
result = result.unstack(level=-1)
print(result)

印刷品

^{pr2}$

对于可能遇到此问题且不需要自定义函数的其他人，请注意您应该始终使用builtin aggregators（下面，由字符串'min'，'mean'和{}）如果可能的话。他们的表现比自定义Python函数。令人高兴的是，在这个玩具问题中，它产生了期望的结果：

In [99]: df.groupby('A')[['B','C']].agg(['min','mean','max'])
Out[99]: 
    B              C          
  min   mean max min  mean max
A                             
1  10  10.75  12   8  15.0  22
2  11  11.50  12  10  11.5  13
3  14  14.00  14   0   0.0   0

网友

2楼 · 编辑于 2024-10-04 15:22:45

像这样的事情也许会奏效。在

df2.groupby('A')[['B','C']]
aggregated = df2.agg(['min', 'mean', 'max'])

然后可以使用swap level来交换列顺序

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas groupby聚合到新列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >