用Scrapy创建.csv文件

import scrapy class hltvspider(scrapy.Spider): name = "hltvspider" allowed_domains = ["hltv.org"] start_urls = ["http://www.hltv.org/?pageid=188&eventid=0&gameid=2"] def parse(self, response): for sel in response.xpath('//ul/li'): title = sel.xpath('a/text()').extract() link = sel.xpath('a/@href').extract() desc = sel.xpath('text()').extract() print title, link, desc

1条回答

网友

1楼 · 发布于 2024-10-01 00:21:09

看看这个对你有用吗

import scrapy
from scrapy.selector import Selector

from megacritics.items import MegacriticsItem

class testspider(scrapy.Spider):
    name = "pupu"
    allowed_domains = ["hltv.org"]
    start_urls = ["http://www.hltv.org/?pageid=188&eventid=0&gameid=2"]

    def parse(self,response):
        hxs = Selector(response)
        sites = hxs.select('//div[@style="width:606px;height:22px;background-color:white"]')
        items = []
        for site in sites:
            item = MegacriticsItem()
            item['date'] = site.select('.//div[@style="padding-left:5px;padding-top:5px;"]/a/div/text()').extract()
            # item['team1'] = site.select('.//div[@class="covSmallHeadline"]/text()').extract()
            # item['team2'] = site.select('.//div[@class="covSmallHeadline"]/text()').extract()
            # item['map'] = site.select('.//div[@class="covSmallHeadline"]/text()').extract()
            # item['event'] = site.select('.//div[@class="covSmallHeadline"]/text()').extract()
            items.append(item)
        return items

相关问题更多 >

编程相关推荐

热门问题

热门文章

用Scrapy创建.csv文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >