<p>正如其他人已经提到的,您应该使用<code>inverse_transform()</code>方法从之前应用的相应转换中检索原始数据。
另一个需要思考的问题是,如果我们的目的是预测<strong>实际的目标'y'值,为什么需要转换目标<code>y_test, y_train</code>?在预测过程中,我们也可以保持它的原始状态。在</p>
<p>另外(在python3.7.3,sklearn0.20.3)中,当您像上面所做的那样标准化单列行时,您会无意中收到一个numpy数组的输出,这对数据帧操作没有帮助</p>
<p>例如:</p>
<p><a href="https://i.stack.imgur.com/9K6av.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/9K6av.png" alt="enter image description here"/></a></p>
<p>当您指定输出应该类似于一个单列数据帧时,您可能会遇到更多问题</p>
<p>例如:</p>
<p><a href="https://i.stack.imgur.com/TdaoA.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/TdaoA.png" alt="enter image description here"/></a>
<a href="https://i.stack.imgur.com/EcqgU.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/EcqgU.png" alt="enter image description here"/></a></p>
<p><strong>解决方案</strong>:必须使用适当的子集选择运算符(.loc/.iloc)在<strong>列表中显式声明目标列名/索引。在</p>
<p>例如:</p>
<p><a href="https://i.stack.imgur.com/wXrGX.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/wXrGX.png" alt="enter image description here"/></a></p>
<p><strong>注意:</strong>在live-ML项目中,测试数据是指当您的模型准备好在产品化阶段进行调优时,将来到达或实时收集的数据。在</p>
<p>一个标准化的训练测试特征集,如<code>X_train, X_test</code>有助于比较特征变量与平均值之间的差异,也有助于对特征变量进行标准化的<strong>正则化</strong>和<strong>主成分分析</strong>技术。在</p>