返回不合理高数字的均方误差

Actor1 Actor2 Actor3 Actor4 Day Director Genre1 Genre2 Genre3 \ 0 0 0 0 0 19.0 0 0 0 0 1 1 1 1 1 6.0 1 1 1 1 2 2 2 2 2 20.0 2 0 2 2 3 3 3 3 3 9.0 3 2 0 -1 4 4 4 4 4 9.0 4 3 3 3 Language Month Production Rated Runtime Writer Year BoxOffice 0 1 0 0 0 118.0 0 2007.0 37500000.0 1 2 1 1 0 151.0 1 2006.0 132300000.0 2 1 1 2 1 130.0 2 2006.0 53100000.0 3 1 2 1 0 117.0 3 2007.0 210500000.0 4 4 3 3 2 117.0 4 2006.0 244052771.0

3条回答

网友

1楼 · 编辑于 2024-09-22 16:38:36

你能检查一下你的模型的准确性吗？我想这是很低的，所以你得到了很高的均方根错误。因为预测票房和实际票房之间的模型精度差很高，而且平方差变得更大。在

rgr.score(X_test,Y_test）

网友

2楼 · 编辑于 2024-09-22 16:38:36

我认为，你的问题与均方误差无关，而是模型本身。在

对于您的分类功能，我建议您尝试另一种编码方法，如OneHotEncoder。LabelEncoder不是线性回归的好选择。在

https://hackernoon.com/what-is-one-hot-encoding-why-and-when-do-you-have-to-use-it-e3c6186d008f）

在训练你的模型之前，先看看你的数字特征与你的目标变量之间的关系，也许其中有些是不相关的，对于分类特征，你可以尝试不同的方法来分析它们与目标变量的关系（比如boxplots）

线性回归需要连续变量，因此您可能也需要尝试其他算法。在应用它们之前，确保你有足够的背景知识。在

网友

3楼 · 编辑于 2024-09-22 16:38:36

尝试标准化输出（或Y）变量，并将它们置于0和1之间。在

相关问题更多 >

编程相关推荐

热门问题

热门文章