Python皮，在一个循环

from scrapy.contrib.spiders import CrawlSpider, Rule from scrapy.spider import Spider from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor from scrapy.selector import Selector from scrapy.http import FormRequest, Request #from etmd.items import Etmditems import scrapy class EtmdSpider(Spider): name = "etmd" start_urls = ["http://b2.nourl.com/dp.asp"] def parse(self, response): url = "http://b2.nourl.com/dp.asp" payload = {"AppKey": "94921000e1999f84a518725", "ComparisonType1_1": "LIKE", "Value1_1": "", "MatchNull1_1" : "N", "ComparisonType2_1" : "LIKE", "MatchNull2_1" : "N", "Value2_1" : "", "ComparisonType3_1": "=", "MatchNull3_1" : "N", "Value3_1" : "", "x":"69", "y":"27", "FieldName1" : "County", "Operator1": "OR", "NumCriteriaDetails1": "1", "Operator2" : "OR", "NumCriteriaDetails2" : "1", "FieldName3": "Year", "Operator3" : "OR", "NumCriteriaDetails3": "1", "PageID" : "2", "GlobalOperator": "AND", "NumCriteria" : "3", "Search" : "1", "cpipage": "4"} return (FormRequest(url, formdata = payload, callback = self.parse_data)) def parse_data(self, response): items = [] sel = Selector(response) items.append(sel.xpath('//td').extract()) exportfile = open( "exported.txt", "a") exportfile.write (str(items)) print items

1条回答

网友

1楼 · 发布于 2024-10-02 04:22:33

return语句将立即退出该方法。在

您应该返回所有请求的列表：

def parse(self, response):
    requests = []
    for i in range(175):
        url = "http://b2.nourl.com/dp.asp"
        payload = {"AppKey": "94921000e1999f84a518725", "ComparisonType1_1": "LIKE", "Value1_1": "", "MatchNull1_1" : "N", "ComparisonType2_1" : "LIKE", "MatchNull2_1" : "N", "Value2_1" : "", "ComparisonType3_1": "=", "MatchNull3_1" : "N", "Value3_1" : "", "x":"69", "y":"27", "FieldName1" : "County", "Operator1": "OR", "NumCriteriaDetails1": "1", "Operator2" : "OR", "NumCriteriaDetails2" : "1", "FieldName3": "Year", "Operator3" : "OR", "NumCriteriaDetails3": "1", "PageID" : "2", "GlobalOperator": "AND", "NumCriteria" : "3", "Search" : "1", "cpipage": "%i" %i}
        requests.append(FormRequest(url, formdata = payload, callback = self.parse_data))
    return requests

或者yield一个接一个：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章