min_sample_split和min_sample_leaf在随机森林分类器中的作用是什么?

2024-07-06 12:48:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试拟合^{},遇到了两个参数:min_sample_split和{}。在

我是否需要同时设置min_sample_splitmin_sample_leaf?在

我想我只需要其中一个,因为其中一个实际上是另一个的一半。我的理解正确吗?在


Tags: sample参数minsplitleaf
1条回答
网友
1楼 · 发布于 2024-07-06 12:48:22

所以基本上,min_sample_split是分割所需的最小样本数。例如,如果min_sample_split = 6并且节点中有4个样本,则不会发生拆分(不管熵是多少)。在

另一方面,min_sample_leaf基本上是叶节点所需的最小样本数。假设min_sample_leaf = 3并且一个含有5个样本的节点可以分别分裂成2个和3个大小的叶子节点,那么这个分裂就不会发生,因为最小的叶子大小为3。在

您可以查看this和{a2}以进一步阅读。在

更新:RandomForest和GradientBoostClassifier在行为上的差异很大程度上归因于它们如何训练自己(梯度提升是一个序列分类器的集合),您可以阅读更多关于它的内容,以了解梯度提升的内部工作原理

相关问题 更多 >