设置groupby上应用结果的列名

import pandas as pd import numpy as np df = pd.DataFrame({'A': ['X', 'Y', 'X', 'Y', 'Y', 'Y', 'Y', 'X', 'Y', 'X'], 'B': ['N', 'N', 'N', 'M', 'N', 'M', 'M', 'N', 'M', 'N'], 'C': [69, 83, 28, 25, 11, 31, 14, 37, 14, 0], 'D': [ 0.3, 0.1, 0.1, 0.8, 0.8, 0. , 0.8, 0.8, 0.1, 0.8], 'E': [11, 11, 12, 11, 11, 12, 12, 11, 12, 12] }) df_grp = df.groupby(['A','B']) df_grp.apply(lambda x: x['C'].sum() * x['D'].mean() / x['E'].max())

2条回答

网友

1楼 · 编辑于 2024-09-27 07:31:49

您可以使用reset_index()将series转换为dataframe，并提供name='yout_col_name'——与序列值对应的列的名称

(df_grp.apply(lambda x: x['C'].sum() * x['D'].mean() / x['E'].max())
      .reset_index(name='your_col_name'))

   A  B  your_col_name
0  X  N   5.583333
1  Y  M   2.975000
2  Y  N   3.845455

网友

2楼 · 编辑于 2024-09-27 07:31:49

让lambda函数返回一个新序列：

df_grp.apply(lambda x: pd.Series({'new_name':
                    x['C'].sum() * x['D'].mean() / x['E'].max()}))

     new_name
A B          
X N  5.583333
Y M  2.975000
  N  3.845455

相关问题更多 >

编程相关推荐

热门问题

热门文章