Python中文
首页
教程
问答
标签
搜索
登录
注册
在数据集的特定列上应用一个热编码,但结果不符合预期
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个五列的数据集</p> <p>数据集:</p> <pre><code>Country Population Tourism Mean_Age Employed Afghanistan 37172386 14000 17.3 Fulltime Albania 2866376 5340000 36.2 Parttime </code></pre> <p>几乎有1000个这样的数据,其中<code>Employed</code>是一个分类列。我想使用一个热编码将<code>Employed</code>列表示为一个数字列</p> <p>我的代码是</p> <pre><code>from sklearn.preprocessing import OneHotEncoder Employed_Status = data["Employed"] encoder = OneHotEncoder() encoder.fit(Employed_Status.values.reshape(-1, 1)) encoder.transform(Employed_Status.head().values.reshape(-1, 1)).todense() </code></pre> <p>这里<code>data</code>是我的数据帧的名称</p> <p>当我在执行上述行之后尝试查看数据集时,我得到了上一个数据集</p> <p>然而,我想我会得到这样的东西</p> <pre><code>Country Population Tourism Mean_Age Employed Afghanistan 37172386 14000 17.3 1 Albania 2866376 5340000 36.2 0 </code></pre> <p>因为我已经在<code>Employed</code>列上应用了一个热编码</p> <p>有谁能告诉我为什么我得到了同样的结果而不是期望的结果</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以这样做:</p> <pre><code>data['Employed'] = data['Employed'].replace('Fulltime',1).replace('Parttime',0) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
区分轴上的像素大小
5 回答
区分过度拟合与良好预测
4 回答
区分通过POST接收的数据并在Cherrypy中获取
10 回答
区分重写和重载
9 回答
区分金贾二号的类型
7 回答
区别:IF IN和IF==python
6 回答
区别:list.append()与incrementequal?
4 回答
区别:创建在启动wx应用程序时不“阻止”控制台的脚本
1 回答
区别于python中的命令行和CGI
3 回答
区别关系
6 回答
区别是什么APIClient.enforce\ csrf\检查以及APIClient.handler.enforce\ csrf\ u检查
1 回答
区块.draw()未在python空闲模式下工作
2 回答
区块链API调用输出对象名称而不是内容
1 回答
区块链nonce值随负载变化
1 回答
区块链Python语法错误(Snakecoin)
10 回答
区块链不连接到服务器和矿工
2 回答
区块链信息钱包支票支付员
5 回答
区块链和区块链密码错误
3 回答
区块链尝试向Transaction字典添加键/值以创建区块链
7 回答
区域:IOError:[Errno 22]无效模式('w')或filenam
2 回答