刮擦不是爬行或刮网站,如seatgeek/viliveseats

2024-10-01 04:59:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从seatgeek上获取机票信息,但我很难做到。当我运行我的代码时,我得到的是:

INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)

我的想法是,我输入节目/活动的名称,scrapy会刮取该节目每一场演出的网址,然后刮取票价等。我的代码如下:

^{pr2}$

这是我的项目.py代码:

^{3}$

任何帮助都将不胜感激-谢谢!在


Tags: 代码info名称itemspagesmin节目at
1条回答
网友
1楼 · 发布于 2024-10-01 04:59:39

我可以看到两个直接的问题:

  • start_urls应该是一个列表;您也应该看到类似这样的错误:

    Traceback (most recent call last):
    (...)
        raise ValueError('Missing scheme in request url: %s' % self._url)
    ValueError: Missing scheme in request url: h
    
  • 默认情况下,start_urls中用于url的回调是parse(),这不是在代码中定义的。也许你应该重命名你的parse_performance()方法?

另外,spider arguments是获取用户输入的更常见的方法。在

相关问题 更多 >