用于向amazon sqs实例输出废弃项的scrapy扩展

scrapy-sqs-exporter的Python项目详细描述


Build StatusCoveralls StatusRequirements Status

废品SQS出口商

这是Scrapy的一个扩展,允许将废弃项导出到amazon sqs实例。

设置

安装包后,需要将库中定义的两个类添加到相关的 设置文件的部分:

FEED_EXPORTERS = {
  'sqs': 'sqsfeedexport.SQSExporter'
}

FEED_STORAGES = {
  'sqs': 'sqsfeedexport.SQSFeedStorage'
}

FEED_STORAGES部分使用前缀为sqs的url将其与其他基于uri的存储区区分开来 选项。

在环境中,我们还需要定义一些键:

AWS_DEFAULT_REGION=eu-central-1
AWS_ACCESS_KEY_ID=...
AWS_SECRET_ACCESS_KEY=...
FEED_URI=sqs://foo
FEED_FORMAT=sqs

AWS_ACCESS_KEY_IDAWS_SECRET_ACCESS_KEY是要使用的aws凭据,以及AWS_DEFAULT_REGION 是SQS实例的默认区域。FEED_URIAWS_DEFAULT_REGION区域例如:

AWS_DEFAULT_REGION=us-east-1
FEED_URI=sqs://bar
FEED_FORMAT=sqs

将引用us-east-1区域中的队列名称bar

最后,FEED_FORMAT选项使scrapy spider使用sqsexporter类。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在Mapreduce程序中两次遍历文本值的迭代器?   java通过web服务获取cookie值中的用户名和密码   Coref分解的javahobbs算法   安卓文件提供商java。lang.IllegalArgumentException:未能找到包含   java从json获取元素   java重复链接列表   java如何保护远程mysql数据库连接   java如何从csv文件中删除特定条目?   java重载一个采用基类并指导扩展类方法实现的方法   java BouncyCastle将自定义别名设置为算法   javasocket传输   从MySQL多线程Java获取响应   JavaHBase api通过行ID列表获取数据行信息   Java应用程序容器