sklearn StandardScaler返回所有零

2024-10-01 17:26:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个sklearnStandardScaler从以前的模型中保存下来,并试图将其应用于新数据

scaler = myOldStandardScaler
print("ORIG:", X)
print("CLASS:", X.__class__)
X = scaler.fit_transform(X)
print("SCALED:", X)

我有三个观察结果,每个都有2000个特征。如果我单独运行每个观察值,我得到的输出是全零。在

^{pr2}$

但是如果我把这三个观测值都加到一个数组中,我就会得到我想要的结果

ORIG: [[  0.00000000e+00   8.69737728e-08   7.53361877e-06 ...,   0.00000000e+00
0.00000000e+00   0.00000000e+00]
[  9.49627142e-04   0.00000000e+00   0.00000000e+00 ...,   0.00000000e+00
0.00000000e+00   0.00000000e+00]
[  3.19029839e-04   0.00000000e+00   1.90985485e-06 ...,   0.00000000e+00
0.00000000e+00   0.00000000e+00]]
CLASS: <class 'numpy.matrixlib.defmatrix.matrix'>
SCALED: [[-1.07174217  1.41421356  1.37153077 ...,  0.          0.          0.        ]
[ 1.33494964 -0.70710678 -0.98439142 ...,  0.          0.          0.        ]
[-0.26320747 -0.70710678 -0.38713935 ...,  0.          0.          0.        ]]

我见过这两个问题:

这两个问题都没有一个公认的答案。在

我试过:

  • 从(1,n)整形到(n,1)(这会产生不正确的结果)
  • 将数组转换为np.float32np.float64(仍然全部为零)
  • 创建一个数组的数组(同样,都是零)
  • 创建一个np.matrix(同样,都是零)

我错过了什么?fit_transform的输入得到相同的类型,只是大小不同。在

如何让StandardScaler使用单个观察值?


Tags: 数据模型nptransform数组matrixclassfit
1条回答
网友
1楼 · 发布于 2024-10-01 17:26:25

当您试图将StandardScaler对象的fit_transform方法应用于大小为(1,n)的数组时,显然会得到所有的零,因为对于数组的每个数,您从中减去的是这个数的平均值,这个数等于这个数的number,然后除以这个数的std。如果你想获得正确的数组缩放比例,你应该把它转换成大小为(n,1)的数组。你可以这样做:

import numpy as np

X = np.array([1, -4, 5, 6, -8, 5]) # here should be your X in np.array format
X_transformed = scaler.fit_transform(X[:, np.newaxis])

在这种情况下,您可以通过一个对象的特征来获得标准的缩放比例,这不是您要寻找的。
如果您想通过3个对象的一个特征进行缩放,那么应该将大小为(3,1)的fit_transform方法数组传递给每个对象对应的特定特征值。在

^{pr2}$

如果你想使用已经安装好的StandardScaler对象,你不应该使用fit_transform方法,因为它会用新数据重新调整对象。StandardScalertransform方法,该方法适用于单个观察:

X = np.array([1, -4, 5, 6, -8, 5]) # here should be your X in np.array format
X_transformed = scaler.transform(X.reshape(1, -1))

相关问题 更多 >

    热门问题