在数据集的特定列上应用一个热编码，但结果不符合预期

from sklearn.preprocessing import OneHotEncoder Employed_Status = data["Employed"] encoder = OneHotEncoder() encoder.fit(Employed_Status.values.reshape(-1, 1)) encoder.transform(Employed_Status.head().values.reshape(-1, 1)).todense()

2条回答

网友

1楼 · 编辑于 2024-10-06 12:30:31

您没有保存输出

out = encoder.transform(...).todense()

data['employed'] = out

可能需要一些争论才能使数据集走到一起。我发现pd.concat(numerical_in, categorical_encoded_in, axis=1)在过去是必需的，但是您可能会发现，一旦保存了密集输出，它就可以工作了

网友

2楼 · 编辑于 2024-10-06 12:30:31

您可以这样做：

data['Employed'] = data['Employed'].replace('Fulltime',1).replace('Parttime',0)

编程相关推荐

java正确使用setCellValueFactory
java当使用flavor维度时，设置Android applicationId的正确方法是什么？
java为了在测试用例中并发执行某些步骤，可以克隆WebDriver实例
JAVA中的If语句给出错误
java在kindle上使用JavaFX
java如何在屏幕上显示多个视图时提高性能？
java“重命名”文件项
使用kafka运行Spark流媒体示例时出现java NoSuchMethodError
java如何在查询视图时返回实体列表
java在条件表达式中使用equals方法

相关问题更多 >

编程相关推荐

热门问题

热门文章

在数据集的特定列上应用一个热编码，但结果不符合预期

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >