一个调度碎片蜘蛛的守护程序

scrapy-do-heroku的Python项目详细描述


https://api.travis-ci.org/ljanyst/scrapy-do.svg?branch=masterhttps://coveralls.io/repos/github/ljanyst/scrapy-do/badge.svg?branch=masterPyPI Version

scrapydo是一个守护进程,它提供了一种运行Scrapyspider的便捷方式。它可以做一次-立即;或者 可以按指定的时间间隔定期运行它们。它的灵感来自 scrapyd但是从头开始写的。它 附带了restapi、命令行客户机和交互式web界面。在

快速入门

  • 使用pip安装scrapy-do

    $ pip install scrapy-do
    
  • 在前台启动守护程序:

    ^{pr2}$ 在
  • 打开另一个终端窗口,下载Scrapy的Quotesbot示例,然后 将代码推送到服务器:

    $ git clone https://github.com/scrapy/quotesbot.git
    $cd quotesbot
    $ scrapy-do-cl push-project
    +----------------+
    | quotesbot      |
    |----------------|
    | toscrape-css   |
    | toscrape-xpath |
    +----------------+
  • 安排一些作业:

    $ scrapy-do-cl schedule-job --project quotesbot \
        --spider toscrape-css --when 'every 5 to 15 minutes'+--------------------------------------+
    | identifier                           |
    |--------------------------------------|
    | 0a3db618-d8e1-48dc-a557-4e8d705d599c |
    +--------------------------------------+
    
    $ scrapy-do-cl schedule-job --project quotesbot --spider toscrape-css
    +--------------------------------------+
    | identifier                           |
    |--------------------------------------|
    | b3a61347-92ef-4095-bb68-0702270a52b8 |
    +--------------------------------------+
  • 看看发生了什么:

    Active Jobs

    默认情况下,web界面在http://localhost:7654可用。在

源代码构建

以下两个步骤都需要安装nodejs。在

  • 检查工作是否正常:

    $ pip install -rrequirements-dev.txt
    $ tox
    
  • 构建车轮:

    $ python setup.py bdist_wheel
    

变更日志

  • 迁移到引导程序4用户界面
  • 为工作添加简短的描述成为可能
  • 允许在传递的每个作业中指定用户定义的有效负载 作为python爬虫程序的参数
  • 支持上述功能的UI更新
  • web UI中的新日志查看器

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何从IBM MQ的JMSException检测可恢复错误   java Lucene6。4.2:找不到类,尝试添加查询。   Java Pdf差异库   在Java中多线程处理我的线程   java将字符串传递给Uri。下载中的parse()   java在列表中查找原语位置   java JPA条件从另一个查询中选择   java中的强制转换和转换   java如何在没有上下文的情况下获取SOAP Web服务(Apache Axis 1.4)的调用客户端的IP地址   java Android IllegalBlockSizeException:解密中最后一个块未完成   java Jersey是否要自定义无效资源路径的错误处理?   如何将JavaCVS web项目转换为基于maven的web项目?   java如何检查通用列表是否与jUnit相等?   arraylist java。util。尝试使用迭代器时发生ConcurrentModificationException错误   使用springsecurity,jsp上的java${u csrf.token}始终为空   sql使用java从临时表中选择数据   spring验证中的java@Notnull和@Pattern无效   java如何使用jQuery将包含对象数组的对象数组传递给Spring MVC控制器?