一个简单的工具,帮助预处理机器学习熊猫数据帧。
grimlock的Python项目详细描述
弹簧锁
我们都知道,当涉及到机器学习,它需要更多的时间 对数据进行预处理,而不是实际构建模型。输入,grimlock。
grimlock将修复丢失的值、处理数据编码和功能缩放。
安装
如果您已经安装了numpy、scipy、sci-kit-learn和pandas,那么grimlock
包是pip
-可安装的:
$ pip install grimlock
清除丢失的数据
熊猫网.fillna()和sklearn输入法
from grimlock import clean_missing clean_missing(dataframe, column, clean_type='zero')
参数
- dataframe:dataframe变量
- 列:列名(字符串)
- clean_type:'zero'(默认)、'mean'、'mode'、'most_frequency'(字符串)
转换分类
分类特征的快速转换(非序数)
from grimlock import convert_categorical convert_categorical(dataframe, column, target_column)
参数
- dataframe:dataframe变量
- 列:列名(字符串)
- 目标列:目标列名(字符串)
功能缩放
即将推出