我试图运行一个spider,它从http://www.hltv.org/?pageid=188&eventid=0&gameid=2获取某些信息,并用这些数据创建一个.csv文件。我希望spider遍历每个日期并为每个列出的日期获取关键信息:http://www.hltv.org/?pageid=188&matchid=19029&eventid=0&gameid=2
到目前为止,我得到的是:
import scrapy
class hltvspider(scrapy.Spider):
name = "hltvspider"
allowed_domains = ["hltv.org"]
start_urls = ["http://www.hltv.org/?pageid=188&eventid=0&gameid=2"]
def parse(self, response):
for sel in response.xpath('//ul/li'):
title = sel.xpath('a/text()').extract()
link = sel.xpath('a/@href').extract()
desc = sel.xpath('text()').extract()
print title, link, desc
以下是我得到的输出:
^{pr2}$
看看这个对你有用吗
相关问题 更多 >
编程相关推荐