获取dataift预览统计数据并将其写入stdout
datasift_preview_grabber的Python项目详细描述
用于在特定日期范围内获取特定哈希的datalift预览统计信息的脚本。
快速启动
如果安装了python和virtualenv,最简单的设置方法是 克隆或下载所有源文件,cd到目录中,然后运行这些 第一次命令:
$ virtualenv .env $ source .env/bin/activate $ python setup.py install
它将安装运行脚本所需的所有内容。
运行脚本
Usage: datasift_preview_grabber <start_date> <end_date> <stream_hash> <datasift-username> <datasift-apikey> Where: start_date and end_date are in the format yyyy-mm-dd
脚本将把您给它的日期范围拆分为单独的天数(一个限制 数据提交预览服务的。每天花费20dpu目前如此 别对你的约会范围太在意了!
对于每一天,脚本都会使用datasift创建一个预览作业。脚本等待 每项工作都要完成,这可能需要一段时间。当所有的工作都完成后, 结果简单地打印到stdout。
进一步开发脚本
如果要以某种方式增强脚本,请从 在您先前创建的virtualenv中测试_requirements.txt,并确保 添加新内容前测试全部通过:
$ pip install -r test_requirements.txt $ nosetests
如果有用的话,以github上的pull请求的形式发送给我们!