我刚开始学习机器学习,我正在看一个教程,导师使用OneHotEncoder进行虚拟编码(他给出的原因是为了使分类特征之间没有关系,例如西班牙(值2)大于法国(值1)。代码如下:
dataset = pandas.read_csv('Data.csv')
X = Dataset.iloc[:,:3].values
onehotencoder = OneHotEncoder( categorical_features=[0])
onehotencoder.fit_transform(X).toarray()
当我在PyCharm上尝试这个时,我得到了以下警告:
DeprecationWarning: The 'categorical_features' keyword is deprecated in version 0.20 and will be removed in 0.22. You can use the ColumnTransformer instead. "use the ColumnTransformer instead.", DeprecationWarning)
所以我去查了ColumnTransformer的文档,但是我不明白怎么做。在
ColumnTransformer
的文档可以是found here。 将OneHotEncoder
传递给transformer
参数,就像创建Pipeline
。在下面是一个如何使用它的例子。在
ColumnTransformer的文档 举例说明。 #TODO:创建一个LabelEncoder对象并将其与X中的每个特征相匹配
如果您希望看到端到端示例,请check。在
相关问题 更多 >
编程相关推荐