Python：如何将字符串附加到一个废弃的列表项？

class MySpider(BaseSpider): name = "teslanews" allowed_domains = ["teslamotors.com"] start_urls = ["http://www.teslamotors.com/blog"] def parse(self, response): hxs = HtmlXPathSelector(response) updates = hxs.xpath('//div[@class="blog-wrapper no-image"]') items = [] for article in updates: item = TeslanewsItem() item["date"] = article.xpath('./div/span/span/text()').extract() item["title"] = article.xpath('./h2/a/text()').extract() item["url"] = article.xpath('./h2/a/@href').extract() items.append(item) return items

1条回答

网友

1楼 · 发布于 2024-09-30 10:33:06

from scrapy.spider import BaseSpider
from urlparse import urljoin


class MySpider(BaseSpider):
    name = "teslanews"
    allowed_domains = ["teslamotors.com"]

    base = "http://www.teslamotors.com/blog"

    start_urls = ["http://www.teslamotors.com/blog"]

    def parse(self, response):

        updates = response.xpath('//div[@class="blog-wrapper no-image"]')

        items = []
        for article in updates:
            item = TeslanewsItem()
            item["date"] = article.xpath('./div/span/span/text()').extract()
            item["title"] = article.xpath('./h2/a/text()').extract()
            item['url'] = urljoin(self.base, ''.join(article.xpath('./h2/a/@href').extract()))

        return items

相关问题更多 >

编程相关推荐

热门问题

热门文章