擅长:python、mysql、java
<p><code>MinMaxScaler(feature_range = (0, 1))</code>将在[0,1]范围内按比例转换列中的每个值。将此作为转换特征的第一个缩放选项,因为它将保留数据集的形状(无失真)。</p>
<p><code>StandardScaler()</code>将把列中的每个值转换为关于平均值0和标准偏差1的范围,即,通过减去平均值并除以标准偏差,将每个值正规化。如果知道数据分布正常,请使用标准缩放器。</p>
<p>如果有异常值,请使用<code>RobustScaler()</code>。或者,您可以删除异常值并使用上述两个定标器中的任何一个(选择取决于数据是否正态分布)</p>
<p>附加说明:如果在列车试验分离前使用定标器,则会发生数据泄漏。列车解体后必须使用定标器</p>