在scraperwiki运行scrapy的助手集合

scrapyrwiki的Python项目详细描述


运行由 ScrapyScraperWiki

在不使用scrapy cli的情况下启动scraper

示例:

fromscrapy.confimportsettingsfromscrapyrwikiimportrun_spiderdefmain():run_spider(MySpider(),settings)if__name__=='__main__':main()

将生成的数据保存到scraperwiki

只需将“scrapyrwiki.pipelines.scraperwikipipeline”添加到项目管道

示例:

fromscrapy.confimportsettingsfromscrapyrwikiimportrun_spiderdefscraperwiki():options={'SW_SAVE_BUFFER':5,'SW_UNIQUE_KEYS':{"MyItem":['url']},'ITEM_PIPELINES':['scrapyrwiki.pipelines.ScraperWikiPipeline'],}settings.overrides.update(options)run_spider(MySpider(),settings)if__name__=='scraper':scraperwiki()

检查ci中的spider合同

只需使用run_测试启动spider即可

示例:

fromscrapyrwikiimportrun_testsfromscrapy.confimportsettingsrun_tests(MySpider(),"output.xml",settings)

注意:用于测试http缓存。在脚本所在的目录中 启动时必须有scrapy.cfg(scrapy需要它来识别这是一个scraper 目录)和带有http缓存数据库的.scrapy目录。

输出是xunit格式,在Jenkins

记录哨兵的刮刀错误

安装scrapy-sentry并设置 环境变量sentry_dsn,带有sentry键。scrapyrwiki将处理 一切为了你。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
用户界面如何在JavaGUI中为按钮创建各种颜色?   使用MSCAPI的RSA密钥包装的java使用   java Spring数据Redis JedisConnectionException:意外的流结束   java饼图未显示预期输出   java hystrixCommand注释commandKey的用途是什么   windows java可以从cmd运行jar,但不能通过双击来运行   java在单击按钮时遍历XML节点   java试图使用日期(int,int,int)构造函数   带有Buildship 2子项目的java不作为项目依赖项链接   java jsonrpc4j:如何从服务器获取列表<SomeObject>?   用于Java应用程序的内存设置MaxDirectMemory和MaxHeapMemory   java如何从以下类型格式化日期   javayoutube。搜索列表搜索不返回任何内容   java My参数在方法中不起作用,因为泛型存在问题   java如何将Map<Key1Type,Val1Type>转换为Map<Key1Type,Val2Type>   JavaJUnit测试:测试用例的改进,测试数组列表的长度?   java如何在Android中解析带有属性值的xml数据?   使用Hibernate对枚举类型进行Java8bean验证