Pandas有助于平均不等长组

df1 = pd.DataFrame( { "phase" : ["PH1", "PH1", "PH1", "PH1", "PH1" , "PH1", "PH1"] , "sname" : ["CB01R", "CB01R", "CB01R", "CB01R", "CB01R", "CB01R", "CB01R"] , "patid" : ["PG01", "PG01","PG01", "PG02", "PG02", "PG02","PG02"] , "vbins" : [0., 50., 80., 0., 50., 80., 90.] , "vprob" : [100., 60., 0., 100., 60., 10., 0.] , } )

phase sname vbins vprob PH1 CB01R 0.5*(0+0) 0.5*(100+100) 0.5*(50+50) 0.5*(60+60) 0.5*(80+80) 0.5*(0+10) 0.5*(NaN+90) 0.5*( NaN+0)

2条回答

网友

1楼 · 编辑于 2024-09-27 22:38:54

df1.groupby(
    [
        'phase', 'sname',
        df1.groupby('patid').cumcount()
    ]
)['vbins', 'vprob'].sum() / 2

enter image description here

网友

2楼 · 编辑于 2024-09-27 22:38:54

您应该尝试pd.pivot\u表，例如：

pd.pivot_table(data=df, index=['phase','sname'], values=['vbins','vprob'], aggfunc='mean')

如果成功了就告诉我

编辑：

考虑到问题的性质，您应该在手动添加另一列之前，参考pivot\表中的分组依据

相关问题更多 >

编程相关推荐

热门问题

热门文章