如何使用分类和非分类特征进行回归

features = df[['grad', 'oblast', 'tip', 'parcela', 'bruto', 'neto', 'osnova', 'neto/bruto', 'zauzetost', 'sipovi', 'garaza', 'nadzemno', 'podzemno', 'tavanica', 'fasada']] results = df[['ukupno gradjevinski din']] trans = ColumnTransformer(transformers=[('onehot', OneHotEncoder(), ['grad', 'oblast', 'tip', 'garaza', 'tavanica', 'fasada']), ('normalizer', Normalizer(), ['parcela', 'bruto', 'neto', 'osnova', 'neto/bruto', 'zauzetost', 'nadzemno'])], remainder='passthrough') # Default is to drop untransformed columns features = trans.fit_transform(features)

print(df[['parcela', 'bruto', 'neto', 'osnova', 'ukupno gradjevinski din']].corr().to_string()) parcela bruto neto osnova ukupno gradjevinski din parcela 1.000000 0.929939 0.930039 0.987574 0.911690 bruto 0.929939 1.000000 0.998390 0.943996 0.878914 neto 0.930039 0.998390 1.000000 0.946102 0.889850 osnova 0.987574 0.943996 0.946102 1.000000 0.937064 ukupno gradjevinski din 0.911690 0.878914 0.889850 0.937064 1.000000

regressors = [ ["Bagging Regressor TREE", BaggingRegressor(base_estimator = DecisionTreeRegressor(max_depth=15))], ["Bagging Regressor FOREST", BaggingRegressor(base_estimator = RandomForestRegressor(n_estimators = 100))], ["Bagging Regressor linear", BaggingRegressor(base_estimator = LinearRegression(normalize=True))], ["Bagging Regressor lasso", BaggingRegressor(base_estimator = Lasso(normalize=True))], ["Bagging Regressor SVR rbf", BaggingRegressor(base_estimator = SVR(kernel = 'rbf', C=10.0, gamma='scale'))], ["Extra Trees Regressor", ExtraTreesRegressor(n_estimators = 150)], ["K-Neighbors Regressor", KNeighborsRegressor(n_neighbors=1)]] for reg in regressors: scores = cross_val_score(reg[1], features, results, cv=5, scoring='r2') scores = np.average(scores) print(reg[0], scores)

1条回答

网友

1楼 · 发布于 2024-10-01 02:40:36

将分类和非分类特征组合到回归模型的一种方法是对分类特征使用一个热编码。为了具体起见，如果您有一个可能有3个值的分类功能，那么您将创建3列，并根据其一个热编码值填充0和1

您可以在第213页的Introduction to Machine Learning with Python: A Guide for Data Scientists一书的第一节热编码（虚拟变量）中找到详细说明、示例和实现

相关问题更多 >

编程相关推荐

热门问题

热门文章