如何避免回归模型中的浮点值

2024-06-20 14:57:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图用线性回归模型,如线性回归模型、SGDRegressor模型、ridge模型、lasso模型来预测葡萄酒质量(范围从1到10)。在

数据集:http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv

独立值:挥发性酸度、残糖、游离二氧化硫、总二氧化硫、乙醇 依赖:质量在

线性模型

regr = linear_model.LinearRegression(n_jobs=3)
regr.fit(x_train, y_train)
predicted = regr.predict(x_test)

线性回归预测值 数组([5.33560542,5.47347404,6.09337194,…,5.67566813, 5.43609198,6.08189])

预测值采用浮点形式,而不是(1,2,3…10) 我试图用numpy取整预测值

^{pr2}$

from sklearn import linear_model
np.random.seed(0)
clf = linear_model.SGDRegressor()
clf.fit(x_train, y_train)
redicted = np.floor(clf.predict(x_test))

sgdregrestor的预测输出值:

array([ -2.77685458e+12,   3.26826414e+12,   4.18655713e+11, ...,
     4.72375220e+12,  -7.08866307e+11,   3.95571514e+12])

这里我无法将输出值转换为整数。在

有人能告诉我用这些回归模型预测葡萄酒质量的最佳方法吗。在


Tags: 模型testmodel质量train线性predictfit
1条回答
网友
1楼 · 发布于 2024-06-20 14:57:06

您正在进行回归,因此输出本质上是连续的。在

你应该注意的是,你关于预测葡萄酒质量的小项目并不是一个分类问题。反应变量y,葡萄酒质量,有内在的顺序,这意味着得分6比得分5严格好。它不是范畴变量,不同的数字只是代表不同的群体,而群体是不可比较的。在

相关问题 更多 >