我对在Python中使用SciKit learn比较陌生。在阅读了一些主题和观看了一些演示之后,我决定自己投入进去。在
所以,基本上,我试图根据一些特征来预测客户的转化率。结果要么活跃(1)要么不活跃(0)。我尝试了KNN和logistic回归。使用KNN我得到的平均准确度是0.893
,而logistic回归是0.994
。后者似乎如此之高,这是否现实/可能?在
总之:假设我的模型确实非常精确,我现在想导入一个具有相同feauture列的新数据集并预测它们的转换(它们将在本月结束)。在上面的例子中,我使用cross_val_score
来获得准确度得分。在
我现在是否需要导入新集合,以某种方式使新集合适合此模型。(不再训练了,现在我只想用它)
有人能告诉我怎么做吗?如果需要其他信息,请对此发表评论。在
提前谢谢!在
除了“Pickle”之外,还可以使用joblib。在
假设已经定义了X,Y
^{pr2}$将模型保存到磁盘
从磁盘加载模型
对于统计问题:当然,这是可能发生的,要么你的数据噪音很小,要么是评论中提到的场景时钟。在
对于分类器的导入,您可以
pickle
它(用pickle
模块将其保存为一个二进制文件,然后在需要时加载它并对新数据使用clf.predict()
方法以后你可以加载它
^{pr2}$相关问题 更多 >
编程相关推荐