如何正确重塑sklearn分类器predict_proba的多类输出？

1条回答

网友

1楼 · 发布于 2024-06-28 20:29:13

如果您提到您正在使用MultiOutputClassifier，这将非常有用，因为scikit learn中用于多类的大多数分类器不会返回与您类似的内容，因此使用示例数据集：

import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.multioutput import MultiOutputClassifier
from sklearn import preprocessing

lb = preprocessing.LabelBinarizer()

from sklearn.datasets import make_classification
X, y = make_classification(n_samples=500,n_classes=10,n_informative=10,n_clusters_per_class=1)
y = lb.fit_transform(y)

设置分类器

forest = RandomForestClassifier(n_estimators=10, random_state=1)
model = MultiOutputClassifier(forest, n_jobs=-1)
model.fit(X, y)

您无需考虑重塑它，只需拉出以下值：

pred = np.array(model.predict_proba(X))

与您之前所做的一样，这将对应于每一行是一个类，每一列是您的观察值：

pred[:,:,1].shape
(10, 500)

要获得概率，只需转置：

prob1 = pred[:,:, 1].T

prob1[:2]
array([[0.9, 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. ],
       [0.1, 0. , 0.1, 0. , 0.7, 0. , 0.1, 0. , 0.1, 0. ]])

与我们实际提取并堆叠的情况相比：

prob2 = np.hstack([i[:,1].reshape(-1,1) for i in model.predict_proba(X)])
array([[0.9, 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. ],
   [0.1, 0. , 0.1, 0. , 0.7, 0. , 0.1, 0. , 0.1, 0. ]])

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何正确重塑sklearn分类器predict_proba的多类输出？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >