机器学习+Python:绘图验证

2024-10-06 12:13:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我想为我的朴素贝叶斯估计量画一条验证曲线,如下所示:

http://scikit-learn.org/stable/auto_examples/model_selection/plot_validation_curve.html

我不明白什么是训练分数。你知道吗

有人能解释一下吗?你知道吗


Tags: orghttpautomodelplothtmlscikitlearn
1条回答
网友
1楼 · 发布于 2024-10-06 12:13:12

培训分数是指在培训过程中获得的分数。例如,当您调用yourmodel.fit(x_train, y_train)之类的内容时,在本例中,是橙色线。在幕后,您的模型正在对您的x\u列车数据(您的特征,例如温度或湿度)和您的y\u列车(您的标签/结果,例如下雨或不下雨)进行预测。非常粗略地,训练分数是根据您的模型正确预测的次数来计算的。例如,您的模型的得分可能为0.9436。。(大约94%),这意味着您的机器学习模型94%的时间输出了正确的决策。你经常会发现,在训练过程中,一个模型的得分往往高于它在测试集上的得分。你可以看到橙色的线看起来好像是1.0,有效地得分100%,但是交叉验证(test)得分最高的是低于100%,这是一个更常见的现象。你知道吗

假设分数为1.0意味着你的模型是完美的,这可能是危险的,因为过度拟合意味着你的模型与你的训练数据过于吻合,不能很好地推广到新数据。我建议查看this更多信息,Sci Kit learns网站有很好的文档。你知道吗

相关问题 更多 >