嘿,我正在使用sklearn.ensemble.IsolationForest,来预测数据的异常值。在
是否可以将模型训练(拟合)到我的干净数据中,然后保存它以供以后使用?
例如保存模型的一些属性,这样下次就不必再调用fit函数来训练我的模型了。在
例如,对于GMM
,我将保存每个组件的weights_
、means_
和{},这样以后我就不需要再训练模型了。在
为了说明这一点,我将其用于在线欺诈检测,对于相同的“类别”数据,这个python脚本将被多次调用,我不想每次需要执行预测或测试操作时都训练模型。在
提前谢谢。在
Tags:
https://docs.python.org/2/library/pickle.html
使用Pickle库。在
适合你的模型。在
用
pickle.dump(obj, file[, protocol])
保存它用
pickle.load(file)
加载它对你的异常值进行分类
sklearn
估计器实现一些方法,使您更容易保存估计器的相关训练属性。有些估计器自己实现__getstate__
方法,但是其他一些,比如GMM
只使用base implementation,它只保存对象的内部字典:将模型保存到光盘的推荐方法是使用^{} 模块:
^{pr2}$但是,您应该保存额外的数据,以便将来可以重新训练您的模型,否则将遭受严重后果(例如被锁定到旧版本的sklearn)。在
从documentation:
尤其是在cysk6>中,它保证了在cysk6>之间的耦合是不稳定的。它在过去看到了向后不兼容的变化。在
如果您的模型变得非常大并且加载变得很麻烦,您还可以使用更高效的
joblib
。根据文件:相关问题 更多 >
编程相关推荐