如何在GridSearchCV中执行分层shufflesplit?

2024-10-02 08:23:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我可以在GridSearchCV中运行StraitifiedShuffleSplit而不必先将其实例化为“ss”,以防代码出现问题吗。在

ss = StratifiedShuffleSplit(n_splits=3, test_size=0.5, random_state=0)

grid_search = GridSearchCV(clf_us, param_grid = {parameter: num_range},cv=ss)

Tags: 代码testsearchsizeparamrandomssgrid
1条回答
网友
1楼 · 发布于 2024-10-02 08:23:40

如果正在构建分类器,并且只关心在每个折叠中保持与完整数据集中相同的标签平衡,则可以通过在GridSearchCV中指定折叠数(例如cv=5)来避免实例化分层shufflesplit。在

根据文献记载:“对于整数/无输入,如果估计器是一个分类器并且y是二进制或多类,则使用分层折叠。在所有其他情况下,使用KFold。” http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html

但是,如果您想更好地控制数据分割,那么就不能避免实例化StratifiedShuffleSplit。请参阅本页的示例以了解test_size参数如何影响拆分:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.ShuffleSplit.html#sklearn.model_selection.ShuffleSplit。在

相关问题 更多 >

    热门问题