2024-10-02 08:23:40 发布
网友
我可以在GridSearchCV中运行StraitifiedShuffleSplit而不必先将其实例化为“ss”,以防代码出现问题吗。在
ss = StratifiedShuffleSplit(n_splits=3, test_size=0.5, random_state=0) grid_search = GridSearchCV(clf_us, param_grid = {parameter: num_range},cv=ss)
如果正在构建分类器,并且只关心在每个折叠中保持与完整数据集中相同的标签平衡,则可以通过在GridSearchCV中指定折叠数(例如cv=5)来避免实例化分层shufflesplit。在
根据文献记载:“对于整数/无输入,如果估计器是一个分类器并且y是二进制或多类,则使用分层折叠。在所有其他情况下,使用KFold。” http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html
但是,如果您想更好地控制数据分割,那么就不能避免实例化StratifiedShuffleSplit。请参阅本页的示例以了解test_size参数如何影响拆分:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.ShuffleSplit.html#sklearn.model_selection.ShuffleSplit。在
如果正在构建分类器,并且只关心在每个折叠中保持与完整数据集中相同的标签平衡,则可以通过在GridSearchCV中指定折叠数(例如cv=5)来避免实例化分层shufflesplit。在
根据文献记载:“对于整数/无输入,如果估计器是一个分类器并且y是二进制或多类,则使用分层折叠。在所有其他情况下,使用KFold。” http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html
但是,如果您想更好地控制数据分割,那么就不能避免实例化StratifiedShuffleSplit。请参阅本页的示例以了解test_size参数如何影响拆分:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.ShuffleSplit.html#sklearn.model_selection.ShuffleSplit。在
相关问题 更多 >
编程相关推荐