sklearn LinearRegression.Predict（）问题

Date DayNum factor1 factor2 factor3 factor4 factor5 factor6 factor7 factor8 factor9 VariableToPredict 9/17/2014 1 592 83686.46 0 0 250 15911.8 832 99598.26 177514 72 9/18/2014 2 1044 79030.09 0 0 203 23880.55 1238 102910.64 205064 274 9/19/2014 3 707 84207.27 0 0 180 8143.32 877 92350.59 156360 254 9/20/2014 4 707 97577.78 0 0 194 16688.95 891 114266.73 196526 208 9/21/2014 5 565 83084.57 0 0 153 13097.04 713 96181.61 143678 270

from sklearn import metrics from sklearn.preprocessing import StandardScaler from sklearn.cross_validation import KFold, cross_val_score from sklearn.linear_model import LinearRegression import pandas as pd d = pd.read_csv("H://My Documents//Python Scripts//RawData//Q2917.csv", "r", delimiter=",") e = pd.read_csv("H://My Documents//Python Scripts//RawData//FY16q2917Test.csv", "r", delimiter=",") #print(d) #b = pd.DataFrame.as_matrix(d) #print(b) x = d.as_matrix(['factor2', 'factor4', 'factor5', 'factor6']) y = d.as_matrix(['VariableToPredict']) x1 = e.as_matrix(['factor2', 'factor4', 'factor5', 'factor6']) y1 = e.as_matrix(['VariableToPredict']) #print(len(train)) #print(target) #use scaler scalerX = StandardScaler() train = scalerX.fit_transform(x1) scalerY = StandardScaler() target = scalerY.fit_transform(y1) clf = LinearRegression(fit_intercept=True) cv = KFold(len(train), 10, shuffle=True, random_state=33) #decf = LinearRegression.decision_function(train, target) test = LinearRegression.predict(train, target) score = cross_val_score(clf,train, target,cv=cv ) print("Score: {}".format(score.mean()))

1条回答

网友

1楼 · 发布于 2024-09-29 02:27:47

为了建立回归模型，需要训练数据和训练分数。这些允许您根据问题拟合一组回归参数。

然后要预测，你需要的是预测数据，而不是预测分数，因为你没有这些——你在试图预测它们！

例如，下面的代码将运行：

from sklearn.linear_model import LinearRegression
import numpy as np

trainingData = np.array([ [2.3,4.3,2.5], [1.3,5.2,5.2], [3.3,2.9,0.8], [3.1,4.3,4.0]  ])
trainingScores = np.array([3.4,7.5,4.5,1.6])

clf = LinearRegression(fit_intercept=True)
clf.fit(trainingData,trainingScores)

predictionData = np.array([ [2.5,2.4,2.7], [2.7,3.2,1.2] ])
clf.predict(predictionData)

看起来好像您在调用predict()时输入了错误数量的参数-看看我的代码片段，您应该能够找到如何更改它的方法。

出于兴趣，您可以在之后运行以下行以访问回归适合数据的参数：print repr(clf.coef_)

相关问题更多 >

编程相关推荐

热门问题

热门文章