我在Python中遵循这个Scikit-Learn example从森林估计器获得{ExtraTreesClassifier()
与默认值一起使用
超参数设置-这意味着max_features='auto'
。这个例子的输出是10个特性的重要性图。
问题1:
当我用max_features=2
重新运行这个示例时,该图仍然显示了所有10个特性的重要特性。是否应该只显示两个功能的重要性?
问题2:
现在,我想将ExtraTreesClassifier(max_features=2)
与RFECV()
一起使用。从RFECV() docs来看,它表示RFECV()
为最好的特征分配了一个排名1的秩-我们可以在RFECV()
的.ranking_
属性中看到这一点。但是,如果我将估计器指定为ExtraTreesClassifier(max_features=2)
,那么{max_features
并返回所有特性的等级?
max_features
指定在确定树的节点中哪一个特征提供了最佳分割时,学习算法将查看多少个特征。为每个节点随机选择特征。所以决策树仍然使用所有的特征。这只是一种加速学习的方法。在相关问题 更多 >
编程相关推荐