大数据(约22GB)的多块Catboost训练模型

2024-09-27 09:33:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图训练一个CatboostClassifier,在csv文件中有大约22GB的数据,这个文件有大约50列。我试着一次在pandas数据帧中加载所有数据,但没能做到。我能用catboost中的多个数据帧来训练模型吗?在


Tags: 文件csv数据模型pandascatboostcatboostclassifier
1条回答
网友
1楼 · 发布于 2024-09-27 09:33:38

我不确定,但您可以尝试在模型中保存快照和快照文件。目的是在被打断的情况下继续学习。在

model = CatBoostClassifier(iterations=50, 
save_snapshot = True,
snapshot_file = 'model_binary_snapshot.model' 
random_seed=42)

它将把模型保存在“model_binary”下_快照.model“你可以重新装载并继续学习。在

^{pr2}$

相关问题 更多 >

    热门问题