解释sklearn的scale（）和乘以STD加上平均值之间的区别

import pandas as pd import numpy as np from sklearn.preprocessing import scale X_scaled = scale(otr_df) X_scaled2 = otr_df.sub(otr_df.mean()) X_scaled2 = X_scaled2.div(otr_df.std()) # Should print all zeroes print (X_scaled - X_scaled2)/X_scaled """ The above prints the following: Date Index1 Index2 Index3 Index4 2016-05-11 0.000706 0.000706 0.000706 0.000706 ... 2016-05-10 0.000706 0.000706 0.000706 0.000706 ... 2016-05-09 0.000706 0.000706 0.000706 0.000706 ... 2016-05-06 0.000706 0.000706 0.000706 0.000706 ... . . . . . . . . . . . . """

1条回答

网友

1楼 · 发布于 2024-09-29 07:34:21

sklearn在标准偏差计算中使用零自由度：

import pandas as pd
import numpy as np

from sklearn.preprocessing import scale

np.random.seed([3,1415])
otr_df = pd.DataFrame(np.random.rand(10, 10))
X_scaled = scale(otr_df)

X_scaled2 = otr_df.sub(otr_df.mean())
X_scaled2 = X_scaled2.div(otr_df.std(ddof=0))
#                                    ^
#                  Specify ddof here |

# Should print all zeroes
print (X_scaled - X_scaled2)/X_scaled

     0    1    2    3    4    5    6    7    8    9
0 -0.0 -0.0 -0.0 -0.0  0.0 -0.0  0.0  0.0  0.0  0.0
1  0.0  0.0  0.0  0.0  0.0 -0.0 -0.0 -0.0 -0.0 -0.0
2 -0.0  0.0 -0.0  0.0  0.0  0.0  0.0 -0.0 -0.0 -0.0
3  0.0  0.0  0.0 -0.0  0.0  0.0  0.0 -0.0  0.0  0.0
4  0.0 -0.0  0.0 -0.0 -0.0  0.0  0.0  0.0  0.0  0.0
5 -0.0 -0.0  0.0  0.0 -0.0  0.0  0.0 -0.0  0.0  0.0
6  0.0 -0.0  0.0  0.0 -0.0 -0.0  0.0  0.0  0.0  0.0
7 -0.0 -0.0 -0.0  0.0 -0.0 -0.0 -0.0  0.0  0.0 -0.0
8  0.0  0.0 -0.0 -0.0 -0.0  0.0 -0.0 -0.0  0.0 -0.0
9  0.0  0.0 -0.0 -0.0  0.0 -0.0 -0.0 -0.0 -0.0 -0.0

相关问题更多 >

编程相关推荐

热门问题

热门文章