如何用测试数据集预测y值?

2024-10-01 07:11:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经成功地使用下面的训练数据集建立了逻辑回归模型。在

X = train.drop('y', axis=1)
y = train['y']

X_train, X_test, y_train, y_test = train_test_split(X, y, 
                                                    test_size=0.5)

scaler = StandardScaler()  
scaler.fit(X_train)

X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

logreg1 = LogisticRegression()
logreg1.fit(X_train, y_train)

score = logreg1.score(X_test, y_test)
cvs = cross_val_score(logreg1, X_test, y_test, cv=5).mean()

我的问题是我想引入测试数据集来预测未知的y值。试验数据中没有y列。如何使用单独的测试数据集预测y值??在


Tags: 数据模型testsizetransformtrain逻辑drop
1条回答
网友
1楼 · 发布于 2024-10-01 07:11:27

使用predict():

y_pred = logreg1.predict(X_test)
score = logreg1.score(X_test, y_pred)
print(y_pred)     // see the predictions

相关问题 更多 >