标签编码器和随机森林分类器的在线学习

2024-10-06 12:15:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个非常大的数据集,需要用于分类,我对数据进行了采样,但这不能保证我的输出中将包含整个标签。如何对数据进行采样以覆盖所有标签? 另外,我想保存我在这个过程中使用的label encoderRandomForestClassifier,以便将它们用于增量学习。我搜索了关于使用RandomForestClassifier的信息,发现set_warm功能只用于添加额外的估计量,而不用于更新权重。而且partial_fit不支持使用随机林。所以我的第二个问题是如何更新label encoderRandomForestClassifier来训练另一个可能有其他标签和更多数据点的数据集


Tags: 数据功能信息encoder过程分类标签增量