Python中文
首页
教程
问答
标签
搜索
登录
注册
使用特定类别的平均值填写
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我想用该列的平均数填充na,但只针对与缺失值相同类别的代表</p> <pre><code>data = {'Class': ['Superlight', 'Aero', 'Aero', 'Superlight', 'Superlight', 'Superlight', 'Aero', 'Aero'], 'Weight': [5.6, 8.6, np.nan, 5.9, 5.65, np.nan, 8.1, 8.4]} Class Weight 0 Superlight 5.60 1 Aero 8.60 2 Aero NaN 3 Superlight 5.90 4 Superlight 5.65 5 Superlight NaN 6 Aero 8.10 7 Aero 8.40 </code></pre> <p>我知道我能做到:</p> <pre><code>df.Weight.fillna(df.Weight.mean()) </code></pre> <p>但这将用整个列的平均值来填充缺少的值</p> <p>下面将用AERO类别的平均值替换空值(这更好,但仍然不好,因为我必须分别对每个类别/类别执行此操作)</p> <pre><code>df.Weight.fillna(df[df.Class == 'Aero'].Weight.mean()) </code></pre> <p>是否可以对其进行抽象,以便自动获取当前行的类,并找到属于该类别的值的平均值,然后替换它,而无需对类值进行硬编码?希望这是有道理的</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>可能您可以使用<code>groupby</code>和<code>apply</code>对每个组进行尝试:</p> <pre><code>df.groupby('Class')['Weight'].apply(lambda g: g.fillna(g.mean())) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
当用户用PYTHON设置一个或一个不带值的URL时,他们怎么能输入一个/a的代码呢?
4 回答
当用户登录到站点时,如何显示不同的导航栏
3 回答
当用户登录时,在Flask中向用户显示处理结果
5 回答
当用户的Flask会话结束时,我如何从Redis后端中移除所有Celery结果?
9 回答
当用户的Okta配置文件字段当前为blan时,更新该字段
2 回答
当用户的付款逾期2天时,从Django模型检索数据
2 回答
当用户的消息以问号结尾时,如何让机器人说些什么?
2 回答
当用户的系统上可能也安装了Python 2.7时,如何在用户的系统上运行Python 3脚本?
9 回答
当用户确定打印数量时,使用Matplotlib打印动画
8 回答
当用户离开时是否可以删除整个网页?
6 回答
当用户给出一个单词时如何打印?
6 回答
当用户继续更改TKin中的值(使用trace方法)时,使用Entry并更新输入的条目
9 回答
当用户编辑表单字段时,从Django时间字段中删除秒数
4 回答
当用户被更改时,消息不会来自web套接字
2 回答
当用户访问表单时,如何使表单为只读,而不具有更改权限
2 回答
当用户试图更改对象的值时,使用描述符类引发RuntimeError
7 回答
当用户调整GUI的大小时,是否有方法更改GUI内容的大小?
7 回答
当用户调整风的大小时,pythontkinter小部件的大小会不均匀
3 回答
当用户购买某个类别时,是否查找其他类别的销售?
4 回答
当用户转到上一页时,Django和芹菜插入操作
7 回答