我有一个332列的数据帧。我想插补值,以便能够使用scikitlearn的决策树分类器。我的问题是,由填充函数得到的数据列只有330。在
from sklearn.preprocessing import Imputer
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
cols = data.columns
new = imp.fit_transform(data)
print(data.shape,new.shape)
(34132, 332) (34132, 330)
根据documentation of ^{} :
因此,这将删除所有缺少的值列。在
相关问题 更多 >
编程相关推荐