虽然我了解潜在的好处,尤其是与GridSearchCV
结合使用,但我想知道为什么它总是这样使用(或者至少从我的理解来看):
Pipeline steps are set for each classifier (with
'passthrough'
for theclf
step). Then,GridSearchCV
equips the pipeline with multiple parameters and classifiers.
我不确定这是否正确,但从我的观点来看,这似乎会导致分类器之前的步骤运行多次,即使它们总是与相同的参数一起使用
这就引出了一个问题,为什么它不被用在其他方面。。。或者这可能吗
首先,让我们创建一个数据集
现在使用网格搜索的常用方法是尝试所有步骤的不同参数。 作为示例,让我们使用
PCA
和SVC
但是,如果需要,可以将前面的步骤应用于分类器本身,并且只在分类器上执行
GridSearch
:问题在于,这种方法无法测试不同步骤之间的参数相关性
相关问题 更多 >
编程相关推荐