基于决策树的条件独立性检验

dtit的Python项目详细描述


……图片::https://img.shields.io/badge/license mit yellow.svg
:目标:https://opensource.org/licenses/mit
:alt:license

*决策树(条件)独立性测试(dtit)。*


简介然后,确定*p(y x,z)=p(y z)*
是否困难,特别是如果变量是连续的。这个包实现了一个简单而有效的条件独立性测试,
在我们编写它时在[link to arxiv]中描述过!]是的。区别于竞争对手的重要特征是:


*速度快。最坏情况下速度标度为o(n_data*log(n_data)*dim),其中dim为max(x_dim+z_dim,y_dim)。但是,摊销速度是o(n_data*log(n_data)*log(dim))。

*它适用于x、y、z中的一些是连续的,一些是离散的情况,或分类(一个热编码)。

*它很容易理解和修改。

*它可以用于无条件的独立性测试,几乎不改变程序。

我们在几秒钟内将此测试应用于成千上万个千维数据点的样本。对于较小的维度和样本大小,只需要一小部分时间。在arxiv-link-coming中描述了该算法,并给出了详细的实验结果和与其他方法的比较。不过,现在,您应该只需查看代码就可以了解发生了什么——它只有90行python,包括详细的注释!

用法
----
基本用法很简单,默认设置在大多数情况下都应该有效。要执行*无条件测试*,请使用dtit.test(x,y):

…从dtit导入dtit





>x=np.ran随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机随机条件测试,只需将第三个变量z添加到输入:

…代码::python

import numpy as np
from dtit import dtit

p)对于p in z),astype(float)
y=np.vstack([np.random.multinomal(20,p)对于p in z])。astype(float)

检查x和y是否相关(p值应在[0,1]上一致)。
pval d=dtit。test(x,y)
检查zd-分离x和y(p值应小)。
pval i=dtit。test(x,y,z)

_ pip:http://www.pip-installer.org/en/latest/



欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JAVA Tictoe Minimax算法不断引发异常   java弹性时间计算器字符串开关   java从表单post操作中检索值   java Selenium webdriver无法在youtube上找到元素   java如何自动填写XFA(PDF)表单?   java为什么我的秒表程序不能运行?   raspberry pi禁用java中的其他声音   java如何配置web。xml,glassfishweb。JSF的xml文件?   使用浏览器运行自动测试时出现java错误。如何运行它?   java如何阻止Swing程序在每次向JTextArea添加文本时调整组件的大小   javajavax。注射注射无效   java如何改进Solaris服务器配置   java如何在elasticsearch后端脱机时处理Hibernate搜索启动   java TCPsocket的延迟很差,除非持续流式传输