我试图爬网的couponation网站优惠券的,但当我是 尝试运行爬虫它的显示错误。请救命啊。 谢谢。在
import scrapy
from scrapy.http import Request
from scrapy.selector import HtmlXPathSelector
from scrapy.spider import BaseSpider
class CuponationSpider(scrapy.spider):
name = "cupo"
allowed_domains = ["cuponation.in"]
start_urls = ["https://www.cuponation.in/firstcry-coupon#voucher"]
def parse(self, response):
all_items = []
divs_action = response.xpath('//div[@class="action"]')
for div_action in divs_action:
item = VoucherItem()
span0 = div_action.xpath('./span[@data-voucher-id]')[0]
item['voucher_id'] = span0.xpath('./@data-voucher-
id').extract()[0]
item['code'] = span0.xpath('./span[@class="code-
field"]/text()').extract()[0]
all_items.append(item)
>**Output** ERROR
File "/usr/lib/python2.7/urllib2.py", line 1198, in do_open
raise URLError(err)URLError: <urlopen error timed out>
2017-07-25 16:36:59 [boto] ERROR: Unable to read instance data, giving
up
删除所有
import
行,仅使用一行:你的类继承应该是:
您已更改
name
和starturl
,请使用:Scrapy
。这就是区别。错误:无法读取实例数据,给出,表明没有从给定的URL接收任何数据。也许你被列入黑名单了。在
这是一个相同的页面,无需重新加载。
所有这些都可以简化为:
相关问题 更多 >
编程相关推荐