残缺过滤重复请求

def start_requests(self): for x in xrange(8): random_form_page = session.query(.... PR = Request( 'htp://my-api', headers=self.headers, meta={'newrequest': Request(random_form_page, headers=self.headers)}, callback=self.parse_PR ) yield PR

2条回答

网友

1楼 · 编辑于 2024-09-28 20:47:11

使用

dont_filter = True in Request object

def start_requests(self):
    for x in xrange(8): 
        random_form_page = session.query(....

        PR = Request(
            'htp://my-api',
            headers=self.headers,
            meta={'newrequest': Request(random_form_page,  headers=self.headers)},
            callback=self.parse_PR,
            dont_filter = True
        )
        yield PR

网友

2楼 · 编辑于 2024-09-28 20:47:11

当您访问一个API时，您很可能希望完全禁用重复过滤器：

# settings.py
DUPEFILTER_CLASS = 'scrapy.dupefilters.BaseDupeFilter'

这样您就不必用dont_filter=True把所有的请求创建代码都弄乱。

编程相关推荐

java GWT对话框从不显示帮助
java在简单的MapReduce作业中带来了极大的开销
javacom。mysql。jdbc。例外情况。jdbc4。MySQLIntegrityConstraintViolationException:列不能为null/onetoone映射
如何通过TCP/IP与Java和Labview进行通信，并发送浮点数据缓冲区？
java Apache camel与spring事件基本示例
java如何使我的秒表应用程序在完全关闭后仍能运行？
java Nutch爬网错误输入路径不存在
java是Mapreduce中按值传递还是按引用传递的键？
正则表达式替换java中的特定字符
Java DOM XML解析

相关问题更多 >

编程相关推荐

热门问题

热门文章

残缺过滤重复请求

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >