对于所有的类,我想检索给定样本的预测分数/概率。我用的是sklearn的随机森林分类器。如果我使用.predict()
,我的代码运行良好。但是为了显示概率,我使用了.predict_proba(X)
,它总是返回相同的值,即使在{
我把我的代码分解成相关的部分:
# ... code ... feature generation / gets the feature data
if rf is None:
rf = RandomForestClassifier(n_estimators=80)
rf.fit(featureData, classes)
else:
prediction = rf.predict(featureData) # gets the right class / always different
proba = rf.predict_proba(featureData)
print proba # this prints always the same values for all my 40 classes
有趣的是,max(proba)
检索.predict()
在第一次运行中返回的类。由于.predict()
按预期工作,我相信错误是在sklearn这边,也就是说,我想有一个标志需要设置。在
有人知道吗?在
我想问题是你总是给
predict_proba
传递相同的参数。下面是我从iris数据集构建树林的代码:当我调用方法
predict
和predict_proba
时,不同参数的类和类日志概率预测也不同,这是可以合理预期的。在样本运行:
^{pr2}$相关问题 更多 >
编程相关推荐