python pandas使用groupby，使用两个条件/列

df Index Cybi_Tag Tag Exp. m/z Intensity Norm_Intensity 114 17 C09.xls 1013.328 1000 0.5 114 17 C10.xls 1013.325 1100 0.6 114 17 D09.xls 1013.33 1200 0.7 114 17 D10.xls 1013.331 1300 0.8 114 18 C11.xls 1013.328 2000 0.9 114 18 C12.xls 1013.326 2100 1.0 114 18 D11.xls 1013.326 2200 1.1 114 18 D12.xls 1013.328 2300 1.2 180 17 C09.xls 1079.47 3000 1.3 180 17 D09.xls 1079.432 3200 1.5 180 17 D10.xls 1079.446 3300 1.6 180 18 C11.xls 1079.452 4000 1.7 180 18 C12.xls 1079.442 4100 1.8

1条回答

网友

1楼 · 发布于 2024-06-28 19:42:32

我认为您需要list级别，用,分隔：

#specify order of MultiIndex levels
resulttable_calc = resulttable.groupby(level=[0,1])
#specify name of MultiIndex levels
resulttable_calc = resulttable.groupby(level=['df Index','Cybi_Tag'])

如果可以使用最新版本的pandas，请使用：

^{pr2}$

然后通过map在列中使用remove MultiIndex进行聚合：

resulttable_calc = resulttable.groupby(level=[0,1])
                              .agg({'Intensity':['mean','std'], 'Exp. m/z': 'mean'})
print (resulttable_calc)
                      Exp. m/z    Intensity            
                          mean         mean         std
df Index Cybi_Tag                                      
114      17        1013.328500  1150.000000  129.099445
         18        1013.327000  2150.000000  129.099445
180      17        1079.449333  3166.666667  152.752523
         18        1079.447000  4050.000000   70.710678

resulttable_calc.columns = resulttable_calc.columns.map('_'.join)
d = {'Intensity_mean':'Average','Exp. m/z_mean':'Exp. m/z', 'Intensity_std':'Norm_Intensity'}
resulttable_calc = resulttable_calc.rename(columns=d).reset_index()
print (resulttable_calc)
   df Index  Cybi_Tag     Exp. m/z      Average  Norm_Intensity
0       114        17  1013.328500  1150.000000      129.099445
1       114        18  1013.327000  2150.000000      129.099445
2       180        17  1079.449333  3166.666667      152.752523
3       180        18  1079.447000  4050.000000       70.710678

相关问题更多 >

编程相关推荐

热门问题

热门文章