管理大型数据集的工具

expressionable的Python项目详细描述


#expressionable python模块
expressionable python模块的官方存储库,它允许:
*将表格数据集从一种格式转换为另一种格式。
*查询大数据集以筛选有用的数据。
*选择要包含在结果数据集中的其他列/功能。
*将各种格式的数据集合并到单个文件中。
*g将结果数据集打包,以及读取gzip文件的能力。



基本用途如下所述,但请参阅[阅读文档]上的完整文档(https://shapeshifter.read the docs.io/en/latest/)。
expressionable对象
表示要转换的文件。然后使用“export-filter-results”方法对其进行转换。下面是一个名为“input_file.tsv”的文件被转换为名为“output_file.h5”的hdf5文件的简单例子,在过滤
有关性别和年龄的数据时:
``python
来自expressionable import expressionable

my_expressionable=expressionable(“input_file.tsv”)
my_expressionable.export_filter_results(“output_file.h5”,filters=“sex='m'and age>;40”)
```
请注意,读取和导出到的文件类型没有说明根据提供的文件扩展名由expressionable显式推断。如有必要,“input_file_type”和“output_file_type”可以显式命名。



\contribution
我们欢迎有助于扩展表达式以兼容其他文件格式的贡献。如果您对贡献感兴趣,请按照[这里](https://github.com/srp33/expressionable/wiki/adding-support/adding-support/expressionable中的其他文件类型)的说明[这里](https://github.com/srp33/expressionable/wiki/wiki/adding-support/expressionable中的其他文件类型)按照[这里](https://http://github.com/www.目前支持的格式输入格式:
*csv
*tsv
*tsv
*json
*excel
*excel
*hdf5
*parquet
*msgpack
*stata
*stata
*picklpickl
*arff
*gct
*gctx
*pdf
*kallisto
*geo
*starreads





<<<<<<<<
*csv
*tsv
*json
*excel
*hdf5
*parket
*msgpack
*stata
*picket
*sqlite
*arff
*arff
*gct
*rmarma
*rma
*geo
*geo
*星
*星
*星
*星
*星

*gct
*rma*jupyternotebook

expressionable可以处理更多的文件格式!预计未来版本中将包含以下格式:
*固定宽度文件(fwf)
*基因组数据共享临床xml



欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在IE10中重新加载另一个帧时,internet explorer Java小程序失败/消失   ThreadLocal变量的java性能   java系统。出来println不是打印输出   java从JAXB类获取元素属性   java组织。天啊。科尔巴。包裹。InvalidName:IDL:omg。org/CORBA/ORB/InvalidName:1.0   java有没有办法让非事务连接抛出异常?   java是否有任何方法可以使用JdbcTemplate和查询/条件Fluent API   javajpa级联类型。刷新不工作?   未考虑java Maven依赖关系管理   java MySQL MBR包含抛出MySQLExceptionError的语句   java验证整数并将其设为5位数   java发现了循环依赖的问题   java Hibernate left join fetch到使用@ManyToMany关联映射的softdeleted实体生成无效查询?   JavaH:commandButton多个操作:下载文件并呈现ajax表   Google Contacts API在Java、C#、Python或Ruby中是否有一个Hello World示例?