不平衡d中的ROC曲线

2024-09-28 21:50:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用ovr分类和梯度提升分类器来预测{0,1,2,3,4,5}中的目标值。大多数数据(2M样本)的目标值在{0,1}中,少数数据(97K个样本)的目标值在{2,3,4,5}。我根据Scikit example绘制了ROC曲线。如图所示,少数类的AUC=0.99。我想知道这是否意味着分类器的性能很高,还是不平衡数据的影响?在

enter image description here更新: 如果我选择目标值为{2,3,4,5}的样本,ROC曲线将是波纹管: enter image description here


Tags: 数据分类器example绘制分类scikit性能曲线