使用logistic回归进行预测(Python Sci Kit Learn)

2024-06-28 19:08:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我对在Python中使用SciKit learn比较陌生。在阅读了一些主题和观看了一些演示之后,我决定自己投入进去。在

所以,基本上,我试图根据一些特征来预测客户的转化率。结果要么活跃(1)要么不活跃(0)。我尝试了KNNlogistic回归。使用KNN我得到的平均准确度是0.893,而logistic回归是0.994。后者似乎如此之高,这是否现实/可能?在

总之:假设我的模型确实非常精确,我现在想导入一个具有相同feauture列的新数据集并预测它们的转换(它们将在本月结束)。在上面的例子中,我使用cross_val_score来获得准确度得分。在

我现在是否需要导入新集合,以某种方式使新集合适合此模型。(不再训练了,现在我只想用它)

有人能告诉我怎么做吗?如果需要其他信息,请对此发表评论。在

提前谢谢!在


Tags: 数据模型主题客户特征scikitlearn例子
2条回答

除了“Pickle”之外,还可以使用joblib。在

## 
from sklearn.linear_model import LogisticRegression
from sklearn.externals import joblib

假设已经定义了X,Y

^{pr2}$

将模型保存到磁盘

filename = 'finalized_model.sav'
joblib.dump(model, filename)

从磁盘加载模型

loaded_model = joblib.load(filename)
result = loaded_model.score(X_test, Y_test)

对于统计问题:当然,这是可能发生的,要么你的数据噪音很小,要么是评论中提到的场景时钟。在

对于分类器的导入,您可以pickle它(用pickle模块将其保存为一个二进制文件,然后在需要时加载它并对新数据使用clf.predict()方法

import pickle 

#Do the classification and name the fitted object clf
with open('clf.pickle', 'wb') as file :
    pickle.dump(clf,file,pickle.HIGHEST_PROTOCOL)

以后你可以加载它

^{pr2}$

相关问题 更多 >