返回sklearn LabelEncod中的标签及其编码值

2024-05-19 01:44:09 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在使用机器学习项目中的LabelEncoder和OneHotEncoder对数据集中的标签（国家名称）进行编码。一切正常，我的模型运行良好。该项目是根据包括客户所在国家在内的许多特征（数据）对银行客户是继续留在银行还是离开银行进行分类。

当我想预测（分类）一个新客户（仅一个）时，我的问题就出现了。新客户的数据仍然没有预处理（即国家名称没有编码）。大致如下：

new_customer = np.array([['France', 600, 'Male', 40, 3, 60000, 2, 1,1, 50000]])

在我学习机器学习的在线课程中，讲师打开包含编码数据的预处理数据集，手动检查法国代码并在new_customer中更新，如下所示：

new_customer = np.array([[0, 0, 600, 'Male', 40, 3, 60000, 2, 1,1, 50000]])

我认为这是不实际的，必须有一种方法自动将法国编码为原始数据集中使用的相同代码，或者至少有一种方法返回一个国家及其编码值的列表。手工编码一个标签似乎很乏味而且容易出错。那么，我如何使这个过程自动化，或者生成标签的代码呢？提前谢谢。

Tags：数据项目代码名称机器编码 new 客户

0条回答

目前没有回答