这个库将任何种类的{integer,float,strings}转换成离散值{1,2,3。。。#类}。
categorical-encode的Python项目详细描述
此包可用于将数据集转换为数值分类数据。 这可以用于许多机器学习模型的各种数据的预处理。有各种可用的特性,例如规范化数据以使数据对模型更有用。此函数将处理数据帧中的任何类型的数据。在
IMPORT:
来自category_分类编码分类导入
p参数:-
- dataframe:要对其进行分类编码的输入数据帧(X)。在
- normalize:此参数确定它是介于0-1(包括1)还是1到类数(1-类数)之间。默认值:False在
- drop_columns:指定需要删除的dataframe列,因为这些列是无用的。默认值:无列
- drop_na:如果设置为True,则删除空值(NaN)。默认值:False
- target_columns:这将创建目标数据帧(Y),而不应用任何编码。默认值:无列
Return
如果提供了target_列,则返回两个DataFrame(X,Y),否则只返回编码的输入DataFrame(X)。在
示例:
来自category_分类编码分类导入
df=categorical(dataframe=df,normalize=True)
对于值在0-1(包括1)之间的所有列,这将返回df作为按列分类编码的列。在
- 项目
标签: