使用特定类别的平均值填写

data = {'Class': ['Superlight', 'Aero', 'Aero', 'Superlight', 'Superlight', 'Superlight', 'Aero', 'Aero'], 'Weight': [5.6, 8.6, np.nan, 5.9, 5.65, np.nan, 8.1, 8.4]} Class Weight 0 Superlight 5.60 1 Aero 8.60 2 Aero NaN 3 Superlight 5.90 4 Superlight 5.65 5 Superlight NaN 6 Aero 8.10 7 Aero 8.40

2条回答

网友

1楼 · 编辑于 2024-10-01 22:37:25

groupby + transform然后填写：

df['Weight'].fillna(df.groupby("Class")['Weight'].transform("mean"))

0    5.600000
1    8.600000
2    8.366667
3    5.900000
4    5.650000
5    5.716667
6    8.100000
7    8.400000
Name: Weight, dtype: float64

网友

2楼 · 编辑于 2024-10-01 22:37:25

可能您可以使用groupby和apply对每个组进行尝试：

df.groupby('Class')['Weight'].apply(lambda g: g.fillna(g.mean()))

编程相关推荐

java Android webRTC音频卷
java Android Studio无法解析com。谷歌。安卓gms。附近的信息。订阅选项。建设者
java无法通过OAuth2将额外参数传递给SpringSecurity。0
Java正则表达式查找重复单词“\\b（\\w+）（\\s++\\1\\b）+”时出现问题
使用RSA进行模块乘法的加密会导致Java卡出错
如果存在多个下游操作符，java不会发送重复记录
java如何按键比较两个JavaPairRDD并比较值？
安卓如何访问java。JAVA中的lang.Object json值？
带Javascript客户端的Thrift Java server OutOfMemoryError
java HTML到PDF字体解析器

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用特定类别的平均值填写

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >