返回sklearn LabelEncod中的标签及其编码值

2024-05-19 01:44:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用机器学习项目中的LabelEncoderOneHotEncoder对数据集中的标签(国家名称)进行编码。一切正常,我的模型运行良好。该项目是根据包括客户所在国家在内的许多特征(数据)对银行客户是继续留在银行还是离开银行进行分类。

当我想预测(分类)一个新客户(仅一个)时,我的问题就出现了。新客户的数据仍然没有预处理(即国家名称没有编码)。大致如下:

new_customer = np.array([['France', 600, 'Male', 40, 3, 60000, 2, 1,1, 50000]])

在我学习机器学习的在线课程中,讲师打开包含编码数据的预处理数据集,手动检查法国代码并在new_customer中更新,如下所示:

new_customer = np.array([[0, 0, 600, 'Male', 40, 3, 60000, 2, 1,1, 50000]])

我认为这是不实际的,必须有一种方法自动将法国编码为原始数据集中使用的相同代码,或者至少有一种方法返回一个国家及其编码值的列表。手工编码一个标签似乎很乏味而且容易出错。那么,我如何使这个过程自动化,或者生成标签的代码呢?提前谢谢。


Tags: 数据项目代码名称机器编码new客户

热门问题