我有一个数据帧,我现在将表示df,我得到一个ndarray,如下所示
十=测向仪[:,5:].值
我想用它作为机器学习模型。我需要对X的第12列进行热编码
我首先使用sklearn对其进行了如下编码
from sklearn.preprocessing import LabelEncoder,OneHotEncoder
labelencoder_x=LabelEncoder()
df[:,12]=labelencoder_x.fit_transform(df[:,12])
这个很好用。在
接下来,我尝试如下一个热编码
^{pr2}$我得到以下错误
ValueError: Input contains NaN, infinity or a value too large for
dtype('float64').
如果有人能在这方面帮助我,我是python编程新手,我很想知道我所做的有什么问题,以及如何修复它。我试着做一些调试看看np.nan公司在第12列中,我得到False,我还检查了第12列中每个元素的类型,它是int
如果只有一列作为分类列,并且希望它是一个热编码列。值得一试
get_dummies()
,它应该会给出您期望的结果。 Pandas Docs相关问题 更多 >
编程相关推荐