二元分类中的不平衡数据集问题

2024-09-30 14:32:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个二进制分类问题,其中数据划分如下:{0:85%,1:15%}。我尝试过重新加权class_权重和其他抽样方法。但我使用的所有方法都给了我不满意的结果。 我的数据集是(91125,57)

Accuracy:1
F1-Score:1
F2-Score:1
Precision:1
Recall:1
AUCROC:1
Kappa:1

有没有其他方法可以用来处理这种情况


Tags: 数据方法二进制分类classprecisionf2f1
1条回答
网友
1楼 · 发布于 2024-09-30 14:32:36

在将数据提供给分类器之前,请确保从功能中删除目标变量:

X = df.drop('target',axis=1) y = df['target']

我还要检查一些自变量是否与目标高度相关。它可能会让您了解是什么导致了不现实的完美分类:

import seaborn as sns sns.heatmap(X_train.corr())

相关问题 更多 >