对数据源进行编码

akagi的Python项目详细描述


https://img.shields.io/pypi/v/akagi.svghttps://img.shields.io/travis/ayemos/akagi.svghttps://readthedocs.org/projects/akagi/badge/?version=latesthttps://pyup.io/repos/github/ayemos/akagi/shield.svghttps://codeclimate.com/github/ayemos/akagi/badges/coverage.svg

赤木

  • 自由软件:麻省理工学院许可证

功能

akagi使您能够从python访问各种数据源,如amazon redshift、amazon s3和google电子表格(以后会有更多)。

安装

通过PIP安装:

pip install akagi

或来源:

$ git clone https://github.com/ayemos/akagi akagi
$ cd akagi
$ python setup.py install

设置

要使用redshiftdatasource,需要设置环境变量akagi_unload_bucket 您喜欢用作redshift unload命令的中间存储的amazon s3存储桶。

$ export AKAGI_UNLOAD_BUCKET=xyz-unload-bucket.ap-northeast-1

要使用SpreadsheetDetaSource,您需要将环境变量google_application_credential设置为 指示您的服务帐户凭据文件。您可以从here获取凭据。

关联的客户端必须具有对工作表的读取权限。

$ export GOOGLE_APPLICATION_CREDENTIAL=$HOME/.credentials/service-1a2b.json

示例

红移数据源

fromakagi.data_sourcesimportRedshiftDataSourceds=RedshiftDataSource('select * from (select user_id, path from logs.imp limit 10000')fordinds:print(d)# iterate on result

s3数据源
fromakagi.data_sourcesimportS3DataSourceds=S3DataSource.for_prefix('image-data.ap-northeast-1','data/image_net/zebra',file_format='binary')fordinds:print(d)# iterate on result

电子表格数据源
fromakagi.data_sourcesimportLocalDataSourceds=SpreadsheetDataSource('1BxiMVs0XRA5nFMdKvBdBZjgmUUqptlbs74OgvE2upms',# sample sheet provided by Googlesheet_range='Class Data!A2:F31')fordinds:print(d)# iterate on result

本地数据源

fromakagi.data_sourcesimportLocalDataSourceds=LocalDataSource('./PATH/TO/YOUR/DATA/DIR',file_format='csv')fordinds:print(d)# iterate on result

学分

这个包是用Cookiecutteraudreyr/cookiecutter-pypackage项目模板。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java置换相关算法   在Java中读取/打开文本文件   java为什么这段代码不适用于CodeEval?   java如何将日历转换为JSON   从txt文件中读取字符串并将其存储到java中的字符数组中   字符编码Java ResourceBundles umlauts搞砸了   java为什么hashmap会根据总大小而不是填充的存储桶调整大小   java如何将Excel单元格中的数字字符串读取为字符串(而不是数字)?   java Guava的LocalCache无法使用,为什么?   java有没有办法强制JVM在单个处理器或内核上运行   java Eclipse不安装软件   将字节转换为java字符串(可能是汉字)   Java正则表达式:提取函数名   JavaTestNG:如何从多个类中指定测试方法顺序?