SVM的数据输入的归一化或标准化

param_grid = [ {'C': [1, 10, 100, 1000], 'kernel': ['linear']}, {'C': [1, 10, 100, 1000], 'gamma': [0.001, 0.0001], 'kernel': ['rbf']}, ] svr = svm.SVC() clf = grid_search.GridSearchCV(svr, param_grid) clf.fit(X_train,TargetT)

scalerI = preprocessing.StandardScaler() X_train = scalerI.fit_transform(InputT) X_test = scalerI.transform(InputCross) svr = SVR(kernel='rbf', epsilon=0.01, C=100, gamma = 0.01) y_rbf = svr.fit(X_train,TargetT) y_hat=svr.predict(X_test)

1条回答

网友

1楼 · 发布于 2024-10-01 15:28:52

只有输入特性X_train需要标准化，而不是目标变量，它应该是分类任务的整数值（例如，二进制分类的0和1数组）或字符串标签（例如'spam'vs'ham'）。对于回归任务（预测连续变量，如以摄氏度表示的温度或以美元表示的价格），它有时可以帮助标准化目标，但这通常不如标准化输入特性有用。
1e-14足够接近0.0，1.00000985足够接近1.0。

另一方面，您可以使用管道缩短代码：

from sklearn.pipeline import make_pipeline
pipeline = make_pipeline(
    preprocessing.StandardScaler(),
    SVR(kernel='rbf', epsilon=0.01, C=100, gamma = 0.01),
)
pipeline.fit(X_train, TargetT)
y_hat = pipeline.predict(X_test)

要网格化搜索这样一个管道的innner模型的参数，您必须使用类名的小写版本作为前缀：例如'svr__C'、'svr__gamma'和{}。在

相关问题更多 >

编程相关推荐

热门问题

热门文章