Python中文
首页
教程
问答
标签
搜索
登录
注册
此数据集是否需要一个热编码?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>下面是UCI数据存储库中的数据集。我想建立一个回归模型,将血小板计数作为因变量(y),其余作为特征/输入</p> <p><a href="https://i.stack.imgur.com/nADh7.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/nADh7.png" alt="Heart_failure data set from UCI repository"/></a></p> <p>然而,在数字形式的数据集中,很少有分类变量,如贫血、性别、吸烟和死亡事件</p> <p>我的问题是:</p> <ol> <li>在建立回归模型之前,我应该对这些变量执行“一次热编码”吗</李> <li>此外,我观察到这些值在不同的范围内,所以我是否应该在应用回归模型之前缩放数据集</李> </ol>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您不必使用一个热编码,因为这些列已经有了数值。虽然如果这些数值实际上是string而不是int或float,那么您应该对它们使用一种热编码。关于缩放数据,变化是相当大的,因此您应该缩放它以避免回归模型偏向于高值</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在python中从数据帧列中删除分类值?
3 回答
如何在python中从数据帧列表中删除引号
2 回答
如何在python中从数据帧创建列表
6 回答
如何在Python中从数据帧创建嵌套的JSON
6 回答
如何在Python中从数据帧显示wordcloud
3 回答
如何在Python中从数据帧的时间戳中删除字符
9 回答
如何在Python中从数据帧绘制简单绘图?
3 回答
如何在python中从数据帧行提取具有特定长度的范围?
6 回答
如何在python中从数据帧设置dict中的值
5 回答
如何在Python中从数据库中获得一个结果
3 回答
如何在python中从数据框中绘制分类条形图
10 回答
如何在Python中从数据框中选择特定细节?
2 回答
如何在python中从数据集中删除unicode
10 回答
如何在python中从数据集中删除某些数值?
4 回答
如何在python中从数据集中选择行
9 回答
如何在Python中从数组中删除元素
4 回答
如何在python中从数组中删除单个倒逗号?
8 回答
如何在python中从数组中删除对象?
2 回答
如何在python中从数组中删除引号
2 回答
如何在python中从数组中删除所有最小值
4 回答