基于多个空列的行计算Groupby统计信息

df : ST LW UD vl E1 e1 pp@yr 2 F3 l1 pp@yr 4 F3 l2 pp@yr 7 E1 e3 pp2@yr 3 F3 l4 pp3@yr 13 E1 e5 pp3@yr 7 F3 l6 pp3@yr 9 E1 e7 pp2@yr 5 E1 e8 pp3@yr 3 F3 f9 pp4@yr 2 F3 f11 pp4@yr 5 F3 f13 pp5@yr 7 F3 f7 pp5@yr 9

mdf ST LW UD vl mean std E1 e1 pp@yr 2 2.0 NaN F3 l1 pp@yr 4 2.0 NaN F3 l2 pp@yr 7 2.0 NaN E1 e3 pp2@yr 3 4.0 1.414214 F3 l4 pp3@yr 13 5.0 2.828427 E1 e5 pp3@yr 7 5.0 2.828427 F3 l6 pp3@yr 9 5.0 2.828427 E1 e7 pp2@yr 5 4.0 1.414214 E1 e8 pp3@yr 3 5.0 2.828427 F3 f9 pp4@yr 2 NaN NaN F3 f11 pp4@yr 5 NaN NaN F3 f13 pp5@yr 7 NaN NaN F3 f7 pp5@yr 9 NaN NaN

finaldf ST LW UD vl mean std E1 e1 pp@yr 2 2.0 NaN F3 l1 pp@yr 4 2.0 NaN F3 l2 pp@yr 7 2.0 NaN E1 e3 pp2@yr 3 4.0 1.414214 F3 l4 pp3@yr 13 5.0 2.828427 E1 e5 pp3@yr 7 5.0 2.828427 F3 l6 pp3@yr 9 5.0 2.828427 E1 e7 pp2@yr 5 4.0 1.414214 E1 e8 pp3@yr 3 5.0 2.828427 F3 f9 pp4@yr 2 3.5 1.5 F3 f11 pp4@yr 5 3.5 1.5 F3 f13 pp5@yr 7 8.0 1.0 F3 f7 pp5@yr 9 8.0 1.0

1条回答

网友
1楼 · 发布于 2024-07-07 09:15:50

如果你想过滤掉数据框中有空值的行，然后计算这些行的平均值和标准值，你可以创建一个掩码，用这个掩码过滤df，然后计算你希望在以后插入到数据框中的值

它看起来像这样：
mask = mdf[(mdf['mean'].isna()) & (mdf['std'].isna())] mean = mask['v1'].mean() std = mask['v1'].std() mdf[(mdf['mean'].isna()) & (mdf['std'].isna())]['mean'] = mean mdf[(mdf['mean'].isna()) & (mdf['std'].isna())]['std'] = std
注意：只需键入&；即可继续为掩码添加限制；（and）|（or），后跟括号中的条件，例如：&；（mdf['ST']='F3'）

相关问题更多 >

编程相关推荐

热门问题

热门文章