我在我的大数据框中有一个分类列列表,我试图对它们进行编码,因为我使用的一些算法不接受字符串(例如knn)
这是我的密码:
#encode categories
from sklearn.preprocessing import LabelEncoder
# LabelEncoder
le = LabelEncoder()
# dataImputed[catgoricalValues] = dataImputed[catgoricalValues].apply(le.fit_transform) #didn't work
dataImputed[catgoricalValues] = le.fit_transform(dataImputed[catgoricalValues].astype(str))
我得到了这个错误:
ValueError: y should be a 1d array, got an array of shape (490546, 11) instead.
在维护数据帧中的所有其他值的同时,如何只对catgoricalValues
列表中的那些值进行编码
试试这个:
相关问题 更多 >
编程相关推荐