模型.拟合与模型.预测sklearn中的差异和用法问题的回答

模型.拟合与模型.预测sklearn中的差异和用法

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

Q1.1：为什么我们使用验证数据而不是测试数据？（在上述场景中） <pre><code>train_x, val_x, train_y, val_y = train_test_split(X, y,test_size=0.3) </code></pre> <blockquote> First of all, the terms validation set and test set are very loosely used in many tutorials and sometimes interchangeably. It is quite possible to call the above <code>val_x, val_y</code> as <code>test_x, test_y</code> </blockquote> Q1.2：为什么不是全部、训练、val和测试？（为什么分开？） 我们所有的机器学习算法都将用于一些实际数据（参考实际测试数据）。然而，在设计出一个算法之后，我们要“测试”它的性能，它的准确度，等等 <blockquote> Actually we currently don't have the real world data! Right? </blockquote> 但是我们有什么？列车数据！因此，我们巧妙地将它的一部分（拆分）放在一边，以便以后测试该算法。一旦模型准备好，测试数据用于评估性能。在 ^{pr2}$ 问题2。：对于模型.预测（）声明，为什么我们要把val_x放在那里？我们不想预测价值吗？在 我们想要预测<code>val_y</code>，但是模型需要<code>val_x</code>来预测y。这正是我们作为参数传递给predict函数的内容。在 <blockquote> I understand it might be confusing to read <code>model</code> <code>predict</code> <code>val_x</code>. So the better way is to interpret it, as <code>model</code> could you u please <code>predict</code> from <code>val_x</code>, and return <code>predicted_y</code>. </blockquote> 我说<code>predicted_y</code>而不是{<cd1>}，因为两者并不完全相似。它们有多大的不同？这就是分数。在 一些术语 <ul> <li>数据集：手头数据。这是后来被分割的数据</li> <li>训练集：它是我们模型学习的数据集的一部分。通常较大，约70-80%。通常用“x”列和“y”列表示</li> <li>测试集：我们为评估模型性能而预留的部分数据集。这个“测试”模型因此得名。表示为测试x和测试y</li> <li>验证集：如果我们希望在学习过程中对准确度进行无偏估计，我们使用另一个数据集分割。通常是为了找到超参数等 <ul> <li>选择最佳执行算法（NB vs DT vs…）</li> <li>微调参数（树深，kNN中的k，SVM中的c）</li> </ul></li> </ul> Q1.3：使用哪个组合的用例是什么？在 <blockquote> You will always have train & test, or all three. However in your case the test is just named as val. </blockquote> 额外问题：在许多教程中，我看到了如何应用标准缩放器。但是，在本教程中，它并不是这样出现的，或者其他函数是否已经扩展了它而不必显式地声明它？在 <blockquote> It all depends on your data. If the data is pre-processed and all scaled properly then StandardScalers need not be applied. This particular tutorial just implies that data is already normalised accordingly. </blockquote>

模型.拟合与模型.预测sklearn中的差异和用法

1 个回答

相关Python问题