一个简单的工具,帮助预处理机器学习熊猫数据帧。

grimlock的Python项目详细描述


弹簧锁

我们都知道,当涉及到机器学习,它需要更多的时间 对数据进行预处理,而不是实际构建模型。输入,grimlock

grimlock将修复丢失的值、处理数据编码和功能缩放。

安装

如果您已经安装了numpy、scipy、sci-kit-learn和pandas,那么grimlock包是pip-可安装的:

$ pip install grimlock

清除丢失的数据

熊猫网.fillna()和sklearn输入法

from grimlock import clean_missing
clean_missing(dataframe, column, clean_type='zero')

参数

  • dataframe:dataframe变量
  • 列:列名(字符串)
  • clean_type:'zero'(默认)、'mean'、'mode'、'most_frequency'(字符串)

转换分类

分类特征的快速转换(非序数)

from grimlock import convert_categorical
convert_categorical(dataframe, column, target_column)

参数

  • dataframe:dataframe变量
  • 列:列名(字符串)
  • 目标列:目标列名(字符串)

功能缩放

即将推出

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
无法在Netbeans 8.2 JDK8u231中创建java Maven项目(Web应用程序)   java如何以设定的时间间隔生成随机数?   java从socket和inputStream的慢速读取   spring SCORM:Java中基于Web的SCORM播放器   Java将函数传递给方法   java绑定通用服务及其实现和子类型   java如何在运行时从选择列表框中动态选择选项?爪哇硒   java Selenium WebDriver什么是“Selenium客户端和WebDriver语言绑定”   elasticsearch需要elasticsearch高级Java客户端更新ByQueryRequest API帮助   JAVA哈希表查找最大值   WSDL操作中的java soapAction属性为空   java访问封闭类或父类方法的一般方法   eclipse在java中运行带有SeleneTestCase的ANT。lang.NoClassDefFoundError   java Hazelcast不会在节点启动时填充ReplicatedMap   如何在Java中从excel中读取特定行?   html JAVA将本地时间(GMT+8)转换为UTC时间   java将自定义端点添加到Spring数据REST存储库中,并以大摇大摆的方式显示   java计算未来位置