sklearn交叉验证的意外结果

r2_scorer = make_scorer(r2_score) clf = neighbors.KNeighborsRegressor() clf = clf.fit(X_train,y_train) score1 = r2_score(y_test,clf.predict(X_test)) > 0.68777300248206585 kfold = model_selection.KFold(n_splits=10, random_state=42) scores2 = cross_val_score(clf,X_test,y_test,cv = kfold, scoring = r2_scorer) scores2 >array([ 0.05111285, 0.65697228, 0.57468009, 0.6706573 , 0.46720042, 0.3763054 , 0.56881947, 0.32569462, -0.16607888, -0.6862521 ]) scores2.mean() > 0.28391114469744039 scores2.std() > 0.4118551721575503

1条回答

网友

1楼 · 发布于 2024-09-30 12:14:45

使用交叉验证功能时：

scores2 = cross_val_score(clf,X_test,y_test,cv = kfold, scoring = r2_scorer)

你生成10个折叠，每折叠一次你就得到r2分数

结果是：

scores2
>array([ 0.05111285,  0.65697228,  0.57468009,  0.6706573 ,  0.46720042,
         0.3763054 ,  0.56881947,  0.32569462, -0.16607888, -0.6862521 ])

如您所见，包含10个值。每个值对应于每个折叠

底线：

每个折叠得到不同的r2分数是正常的，因为每个折叠的数据分割并不完全相同

相关问题更多 >

编程相关推荐

热门问题

热门文章