我有一个非常大的数据集,需要用于分类,我对数据进行了采样,但这不能保证我的输出中将包含整个标签。如何对数据进行采样以覆盖所有标签?
另外,我想保存我在这个过程中使用的label encoder
和RandomForestClassifier
,以便将它们用于增量学习。我搜索了关于使用RandomForestClassifier
的信息,发现set_warm
功能只用于添加额外的估计量,而不用于更新权重。而且partial_fit
不支持使用随机林。所以我的第二个问题是如何更新label encoder
和RandomForestClassifier
来训练另一个可能有其他标签和更多数据点的数据集
目前没有回答
相关问题 更多 >
编程相关推荐