对sklearn GridSearchCV使用单独的预定义验证集

ts_train = extractPlainTable(np.load('TimeSeries/train_x%d_30.npy' % i),s) ts_val = extractPlainTable(np.load('TimeSeries/validation_x%d_20.npy' % i),s) ts_test = extractPlainTable(np.load('TimeSeries/test_x%d_30.npy' % i),s) labels_train = np.load('ground_truth/train_y%d_30.npy' % i) labels_val = np.load('ground_truth/validation_y%d_20.npy' % i) labels_test = np.load('ground_truth/test_y%d_30.npy' % i) clf = RandomForestClassifier() merged_ts = np.concatenate((ts_train,ts_val),axis=0) merged_labels = np.concatenate((labels_train,labels_val),axis=0) mytestfold = [] for i in range(len(ts_train)): mytestfold.append(-1) for i in range(len(ts_val)): mytestfold.append(0) ps = PredefinedSplit(test_fold=mytestfold) grid_search = GridSearchCV(estimator=clf, param_grid=param_grid,cv=ps) grid_search.fit(merged_ts, merged_labels)

1条回答

网友

1楼 · 发布于 2024-09-28 12:14:07

您可以通过一对train/val索引传递iterable。在

split = [(range(len(ts_train)), range(len(ts_train), len(ts_train) + len(ts_val)))]
grid_search = GridSearchCV(estimator=clf, param_grid=param_grid, cv=split)
grid_search.fit(merged_ts, merged_labels)

相关问题更多 >

编程相关推荐

热门问题

热门文章