Numpy：输入NaN值不是buggy（sklearn）就是不改变数组

x_train = x_train.T for column in x_train: median = column[int(len(column)/2)] column[column == np.nan] = median column[column == np.inf] = 0 column[column == -np.inf] = 0 x_train = x_train.T

[ 4.40572853e-01 4.39998817e-01 4.44360730e-01 4.01524000e+02 4.01524000e+02 4.01524000e+02 4.83419270e-02 4.82160365e-02 4.91767511e-02 nan nan nan nan nan nan 3.33333333e+01 3.33333333e+01 3.33333333e+01 nan nan nan]

1条回答

网友

1楼 · 发布于 2024-10-05 14:26:26

列未排序，并且包含您应该使用np.nanmean() 你应该用np.isnan()而不是==。你知道吗

x_train = np.array([[np.inf, 1, 1, np.nan], [2, 2, np.nan, 2,], [10, np.nan, 10, 10]])

print(x_train)

x_train = x_train.T
for column in x_train:
    # median = column[int(len(column)/2)] 
    median = np.nanmedian(column)
    # column[column == np.nan] = median
    column[np.isnan(column)] = median
    column[column == np.inf] = 0
    column[column == -np.inf] = 0
x_train = x_train.T

print(x_train)

印刷品

[[ inf   1.   1.  nan]
 [  2.   2.  nan   2.]
 [ 10.  nan  10.  10.]]

[[  0.    1.    1.    6. ]
 [  2.    2.    5.5   2. ]
 [ 10.    1.5  10.   10. ]]

相关问题更多 >

编程相关推荐

热门问题

热门文章