数据生成工具
databuild的Python项目详细描述
make用于您的数据。
用于数据操作的自动化工具。
灵感来源于开放精炼。
Databuild中的一般原则是:
- 低进入门槛
- 易于安装
- 易于掌握
- 可扩展
Databuild对于以下情况非常有用:
- 在infoviz项目中记录数据转换
- 以声明的方式自动化数据处理
安装
安装databuild:
$ pip install databuild
快速启动
有关详细信息,请参见Extended Documentation。
$ data-build.py buildfile.json
buildfile.yaml包含要对其执行的操作列表 数据。把它想象成电子表格的脚本。
生成文件的示例可以是:
-operation:sheets.import_datadescription:Importing data from csv fileparams:sheet:dataset1format:csvfilename:dataset1.csvskip_last_lines:1-operation:columns.add_columndescription:Calculate the gender ratioparams:sheet:dataset1name:Gender Ratioexpression:language:pythoncontent:"returnfloat(row['TotaleMaschi'])/float(row['TotaleFemmine'])"-operation:sheets.export_datadescription:save the dataparams:sheet:dataset1format:csvfilename:dataset2.csv
还支持json构建文件。databuild将猜测类型 基于扩展名。
许可证
根据BSD 3条款许可。