2024-07-06 12:48:22 发布
网友
我正在尝试拟合^{},遇到了两个参数:min_sample_split和{}。在
min_sample_split
我是否需要同时设置min_sample_split和min_sample_leaf?在
min_sample_leaf
我想我只需要其中一个,因为其中一个实际上是另一个的一半。我的理解正确吗?在
所以基本上,min_sample_split是分割所需的最小样本数。例如,如果min_sample_split = 6并且节点中有4个样本,则不会发生拆分(不管熵是多少)。在
min_sample_split = 6
另一方面,min_sample_leaf基本上是叶节点所需的最小样本数。假设min_sample_leaf = 3并且一个含有5个样本的节点可以分别分裂成2个和3个大小的叶子节点,那么这个分裂就不会发生,因为最小的叶子大小为3。在
min_sample_leaf = 3
您可以查看this和{a2}以进一步阅读。在
更新:RandomForest和GradientBoostClassifier在行为上的差异很大程度上归因于它们如何训练自己(梯度提升是一个序列分类器的集合),您可以阅读更多关于它的内容,以了解梯度提升的内部工作原理
所以基本上,
min_sample_split
是分割所需的最小样本数。例如,如果min_sample_split = 6
并且节点中有4个样本,则不会发生拆分(不管熵是多少)。在另一方面,
min_sample_leaf
基本上是叶节点所需的最小样本数。假设min_sample_leaf = 3
并且一个含有5个样本的节点可以分别分裂成2个和3个大小的叶子节点,那么这个分裂就不会发生,因为最小的叶子大小为3。在您可以查看this和{a2}以进一步阅读。在
更新:RandomForest和GradientBoostClassifier在行为上的差异很大程度上归因于它们如何训练自己(梯度提升是一个序列分类器的集合),您可以阅读更多关于它的内容,以了解梯度提升的内部工作原理
相关问题 更多 >
编程相关推荐