横断面和时间序列数据插补算法

impyute的Python项目详细描述


https://travis-ci.org/eltonlaw/impyute.svg?branch=masterhttps://img.shields.io/pypi/v/impyute.svg

导入

impyute是一个缺失数据插补算法库。这个图书馆被设计成超轻的,这里有一个潜峰在什么样的impyute可以做。

>>>n=5>>>arr=np.random.uniform(high=6,size=(n,n))>>>for_inrange(3):>>>arr[np.random.randint(n),np.random.randint(n)]=np.nan>>>print(arr)array([[0.25288643,1.8149261,4.79943748,0.54464834,np.nan],[4.44798362,0.93518716,3.24430922,2.50915032,5.75956805],[0.79802036,np.nan,0.51729349,5.06533123,3.70669172],[1.30848217,2.08386584,2.29894541,np.nan,3.38661392],[2.70989501,3.13116687,0.25851597,4.24064355,1.99607231]])>>>importimpyuteasimpy>>>print(impy.mean(arr))array([[0.25288643,1.8149261,4.79943748,0.54464834,3.7122365],[4.44798362,0.93518716,3.24430922,2.50915032,5.75956805],[0.79802036,1.99128649,0.51729349,5.06533123,3.70669172],[1.30848217,2.08386584,2.29894541,3.08994336,3.38661392],[2.70989501,3.13116687,0.25851597,4.24064355,1.99607231]])

功能支持

  • 横断面数据的估算
    • K-近邻
    • 用链式方程进行多元插补
    • 期望最大化
    • 平均插补
    • 模式插补
    • 中值插补
    • 随机插补
  • 时间序列数据的插补
    • 最后一次观察结果结转
    • 移动窗口
    • 自回归综合移动平均(WIP)
  • 诊断工具
    • 伐木工人
    • 空值分布
    • 估算值比较
    • Little's MCAR测试(WIP)

版本

目前在2.7、3.4、3.5、3.6和3.7上测试

安装

要安装impyute,请运行以下命令:

$ pip install impyute

或获取最新版本:

$ git clone https://github.com/eltonlaw/impyute
$ cd impyute
$ python setup.py install

文件

这里有文档:http://impyute.readthedocs.io/

如何贡献

签出CONTRIBUTING

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java我能在这个程序中更好地使用内存吗?   为什么我的Java while循环迭代了一半   java IntelliJ IDEA不在构建时复制资源   socket仅在Java TCP服务器输出上检查客户端断开连接   java游戏物理摩擦   java片段onClick调用方法   symja数学分析器中无法识别java Abs[x]   java在使用泛型时创建二进制搜索树类的实例?   java在外键约束表上的添加和删除   语法java表达式的含义,如果有条件   java创建内联对象并作为参数传递   是否有相当于Redis排序集(zset)的Java数据结构   java找不到适合的方法(无参数)   音频文件操作给定字节帧的音量Java   Eclipse4不以JavaWebStart启动   java如何使用org在JSON对象中获取嵌套的键元素。json?   java与Jackson的反序列化:“org.codehaus.Jackson.map.JsonMappingException:无法反序列化[projectname]的实例。”   字符串的Java正则表达式   spring集成上的java检测缺火指令