使用此过滤器可以更快、更聪明地分析熊猫

dfilter的Python项目详细描述


dfilter-python:机器学习一些统计量的分析工具
===============================

**注意: 本项目维护更新看作者心情!**

.. contents::


介绍
----

dfilter-python 采用 Python2.7 编写。

import,很简单:

.. code-block:: python

import dfilter



快速开始
---------

准备
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

**Tips** :

1. 确保你的系统里面已经安装了 `Python2.7 <https://www.python.org/>`_ ,不同作业系统如何安装不再赘述。
2. 检查你系统中 `python` 和 `pip` 的版本, 如果不属于 `python2.7` , 请在执行代码范例时,自行将 `python` 和 `pip` 分别替换成 `python2.7` 和 `pip2` 。
3. 确保你的系统中安装了 `git` 程序 以及 `python-pip` 。




函数使用 ----在 pandas 后
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

**get_colume_name_as_list** (dataframe)

得到数据的列名称。

**basic_info** (dataframe,列名)

得到数据列的基础信息。

**get_coverage** (dataframe,列名)

得到数据列元素的覆盖率。

**get_pearson_similarity** (dataframe,列名1,列名2,是否均值填充空值)

得到数据的皮尔逊相关系数。

**get_fisher_score** (dataframe,列名1,y[列表],是否均值填充空值)

得到数据的Fisher得分。

**get_fisher_score_with_list** (dataframe,[列名1,列名2,.....],y[列表],是否均值填充空值)

输入列中元素的Fisher得分。

**get_K_L_divergence** (dataframe,列名1,列名2)

输入列中元素的KL散度

**get_K_L_divergence_as_list** (dataframe,[列名1,列名2,.....])

输入列中元素的KL散度。

**get_K_L_divergence_as_list_with_y** (dataframe,[列名1,列名2,.....],y[列表])

输入列中元素的KL散度。

**check_normal_cluster** (dataframe,列名,是否均值填充空值)

输入列中元素的 正态检验

**get_homogeneity_of_variance** (dataframe,列名1,列名2,是否均值填充空值)

输入列中元素的 方差齐性检验

**compare_between_two_couples** (dataframe,列名1,列名2,是否均值填充空值)

输入列中元素的 两组数之间的比较

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Intellij通过方法中的包查找用法   java中VS代码和打包命名的问题   将java CMS功能集成到具有高度动态内容的网站(Lucene/Mysql/Nosql)的策略   oracle的java类强制转换异常。jdbc。驾驶员OracleConnection   字节码向JVM添加上指令   如何在抽象类中执行java方法?   java是否可以在apache访问日志中排除指定的GET参数?(作者:W7开发环境)   java如何获取已安装音频播放器的列表?   尝试向HS学生展示如何使用Java访问MS数据库   使用正则表达式java对给定行中的特定字符串进行计数   java JOOQ Select查询中的Select计数   方法Java,如何从二维双精度数组中找到特定值?   获取图像URL的java正则表达式   java在切换到新的窗口驱动程序后找不到元素