有没有办法将包含预标记目标变量的数据集传递给XGBClassifier.fit()?

2024-09-28 22:19:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个非常不平衡的多类分类数据集,我正在使用sklearn的XGBoost分类器。在训练/测试分割之后,测试数据中有一些标签,而训练数据中没有。因此,当我调用XGBoostClassifier.fit()时,会产生错误,因为它首先在训练数据中的目标变量上拟合LabelEncoder,然后转换测试数据。我想知道是否有任何方法可以避免在XGBClassifer.fit()函数中拟合LabelEncoder我想将带有预先标记的目标变量的数据传递给它)

我发现XGBClassifier alwasy适合LabelEncoder(在检查了它的源代码之后)。我不想在分割列车/测试数据时平衡类。那么,有人能提出一种替代方法吗?提前谢谢


Tags: 数据方法函数目标分类器错误分类标签