我开始关注Scrapy,希望有一个蜘蛛来获取MTG卡的一些价格
首先,我不知道我是否100%正确地使用了在函数开头选择所有可用卡的链接:
name = 'bazarmtgbot'
allowed_domains = ['www.bazardebagda.com.br']
start_urls = ['https://bazardebagda.com.br/?view=ecom/itens&tcg=1&txt_estoque=1&txt_limit=160&txt_order=1&txt_extras=all&page=1']
1-我应该使用这种起始URL吗
2-那么,如果你访问该网站,我找不到如何获得该卡的单位和价格,它们是空白DIV的
我的名字是用:
titles = response.css(".itemNameP.ellipsis::text").extract()
3-我找不到如何对此网站进行分页以获取下一组项目单位/价格。我需要复制起始URL N次吗
(和3)从给定的页面开始就可以了。在进行抓取时,您可以通过查找“下一页”按钮、抓取该链接和
yield
要跟踪的scrapy.Request
等方式将要抓取的其他URL排队。请参阅Scrapy教程的this part相关问题 更多 >
编程相关推荐