进气镶木地板插件

intake-parquet的Python项目详细描述


#进气镶木地板

[![生成状态](https://travis-ci.org/ContinuumIO/intake-parquet.svg?branch=master)](https://travis-ci.org/ContinuumIO/intake-parquet) [![文档状态](https://readthedocs.org/projects/intake-parquet/badge/?version=latest)](http://intake-parquet.readthedocs.io/en/latest/?徽章=最新)

[进气数据加载器](https://github.com/ContinuumIO/intake/)接口到拼花地板二进制表格数据格式。

拼花在大数据生态系统中非常流行,因为它提供了 以及对数据的分块访问,具有高效的编码和压缩。这使得 这种格式特别适用于在 更大的数据集,因此它与hadoop和spark一起使用。

拼花数据可以是单个文件、文件目录或嵌套目录,其中 目录名在数据分区中是有意义的。

###功能

镶木地板插件允许:

  • 高效的元数据解析,因此您知道数据类型和记录数 加载任何数据
  • 分区的随机访问
  • 列和索引选择,仅加载所需的数据
  • 传递基于值的筛选器,即只加载包含 有效数据(注意:不过滤分区内的值)

###安装

conda安装说明如下:

` conda install -cconda-forgeintake-parquet `

###示例

请参阅examples/目录中的笔记本。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
用setter将对象转换为java中的映射   java如何通过JQL直接找到多对多实体的交集?   java Android文本检查帮助   纸牌游戏中的java玩家顺序   java从活动A移动到活动B,再从活动B返回到活动A   java如何在GAE servlet中保存JSON文件以满足Android客户端的请求?   连接到本地主机上的SLiM服务器时发生java错误:8080   java是否可以使用setOnMarkerClickListener对for循环中创建的各种标记产生不同的结果?   检查数字是否为回文的java逻辑   java在两个独立的服务中是否存在数据同步模式?   java在组合框中选择ascendingorder时如何对元素列表进行排序   java如何在不更新旧表的情况下更新表中的字段并将其插入新表   javasos和return语句   java与示例安卓活动建立解析连接。错误:任务“:app:dexDebug”的执行失败   java Maven发布问题,带有代理授权的分叉部署过程,因为参数失败,需要407代理授权