如何使用pandas创建交叉表来展示随机森林预测器的预测结果？

from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import make_scorer, accuracy_score from sklearn.model_selection import GridSearchCV from sklearn.model_selection import train_test_split X_all = t2002.drop(['MainMode_B03ID'],axis=1) y_all = t2002['MainMode_B03ID'] p = 0.2 X_train,X_test, y_train, y_test = train_test_split(X_all,y_all,test_size=p, random_state=23) clf = RandomForestClassifier() acc_scorer = make_scorer(accuracy_score) parameters = { } # parameter is blank grid_obj = GridSearchCV(clf,parameters,scoring=acc_scorer) grid_obj = grid_obj.fit(X_train,y_train) clf = grid_obj.best_estimator_ clf.fit(X_train,y_train) predictions = clf.predict(X_test) print(accuracy_score(y_test,predictions))

2条回答

网友

1楼 · 编辑于 2024-06-26 13:44:04

您可以首先使用sklearn创建一个混淆矩阵，然后将其转换为pandas数据帧。在

from sklearn.metrics import confusion_matrix
#creating confusion matrix as array
confusion = confusion_matrix(t2002['MainMode_B03ID'].tolist(),predictions)

#converting to df
new_df = pd.DataFrame(confusion,
                 index = t2002['MainMode_B03ID'].unique(),
                 columns = t2002['MainMode_B03ID'].unique())

网友

2楼 · 编辑于 2024-06-26 13:44:04

用熊猫很容易显示所有的预测结果。使用cv_results_，如docs中所述。在

import pandas as pd

results = pd.DataFrame(clf.cv_results_) # clf is the GridSearchCV object
print(results.head())

相关问题更多 >

编程相关推荐

热门问题

热门文章