报废项目记录扩展

os-scrapy-record的Python项目详细描述


os废唱片

Build StatuscodecovPyPI - Python VersionPyPI

这个项目提供了过程响应/失败的扩展,生成标准项。在

安装

pip install os-scrapy-record

您可以直接在项目根路径中运行示例spider

^{pr2}$

原料药

  • os_scrapy_record.ResponseCallback

    • 此扩展的callback方法将替换默认的Request.callback,处理响应并生成FetchRecord
    • 当请求已设置回调函数时,callback方法将不起作用
    • callback方法将覆盖spider的parse方法
    • 在项目中启用扩展设置.py文件:
    EXTENSIONS = {
        "os_scrapy_record.ResponseCallback": 1,
    }
    
  • os_scrapy_record.ResponseErrback

    • 此扩展的errback方法将替换默认的Request.errback,处理失败并生成FetchRecord
    • 当请求已经设置errback函数时,errback方法将不起作用
    • 在项目中启用扩展设置.py文件:
    EXTENSIONS = {
        "os_scrapy_record.ResponseErrback": 1,
    }
    
  • os_scrapy_record.FetchRecord

    此类是Item的子类

    这个班的学生有:

    • 请求:os_scrapy_record.items.RequestItem,成员:url、方法、头、正文
    • meta:dict,请求.meta,最好使用小写,并以''uu'作为分隔符作为键
    • 响应:os_scrapy_record.items.ResponseItem,成员:头、正文、状态、ip地址(scray 2.1.0+),失败
  • os_scrapy_record.fetch_status.FetchStatus

    响应项的数量,包括HTTP、DNS、网络和用户定义的状态。它是一个双元组对象:组和代码。例如,HTTP:200, DNS:-2个, 服务器:111, 规则:16在

单元测试

sh scripts/test.sh

许可证

麻省理工学院授权。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用无循环和乘法的递归调用查找值   java字符串大小冲突   在一组Java文件对象中查找唯一的超级目录   没有Eclipse控制台输出窗口(Java)?   java这怎么等于105而不是15?   java Adempiere列调出,用于不处理从(代码)选项导入和创建行的字段   java tomcat、2个webapps、2个log4js,但这两个应用都记录到一个文件中   lambda理解Java谓词   HotspotFX上的Java EOF问题   java google应用程序引擎:如何向连接/断开通道“ping”添加信息?   java如何使用VTDXML获取一个元素的所有名称空间声明?   java如何使用drawLine()获得一条线以随机方向拍摄?   java transactionManager应该使用哪个SessionFactory?   java在安卓上播放声音   在Mac上使用JBDC对SQL Server进行java Windows身份验证   java基本列表和字符串[]   java NamedParameterJdbcTemplate从中选择*   扩展上的java Android可扩展列表视图   使用ApacheAxis2的java SOAP附件