如何在scrapy中仅获取掉落的项目？

1条回答

网友

1楼 · 发布于 2024-09-30 14:37:57

监听item_dropped信号：

import scrapy
import scrapy.signals
from scrapy.crawler import CrawlerProcess


class Spider(scrapy.Spider):
    name = 'spider'
    start_urls = ['http://example.com']

    def parse(self, response):
        yield {'url': response.url}


process = CrawlerProcess()

def item_dropped(item, response, spider):
    print(results)

process.crawl(Spider)
for p in process.crawlers:
    p.signals.connect(item_dropped, signal=scrapy.signals.item_dropped)

process.start()

编程相关推荐

用Java打印布尔数组
java rich:datascroller不使用Internet Explorer上的rich:datatable
java以编程方式将vector drawable/SVG绘制到屏幕上
javacom。fasterxml。杰克逊。数据绑定。exc.InvalidDefinitionException:没有为ObjectReader配置值类型
java无法在Spring Boot中加载静态文件
java“未能延迟初始化角色集合”异常即使在我使用OSIV模式时也会发生
java Glass Fish 3连接拒绝Netbeans IDE 8
java警告：在类型“onLifeCycleeEvent”中找不到注释方法“value（）”：安卓类文件。拱生命周期。未找到OnliFecCycleeEvent
java Android用户界面停止响应
java从字符串末尾获取整数（可变长度）

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在scrapy中仅获取掉落的项目？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >