如何将start_url添加为项目？

2024-10-04 05:30:29 发布

您现在位置：Python中文网/ 问答频道 /正文

9072

网友

男 | 程序猿一只，喜欢编程写python代码。

我不熟悉Python和Scrapy。我希望item['Source_Website']成为我正在爬行的url。我怎样才能做到这一点

我试过{}和{}但没有成功

from scrapy.selector import Selector
from scrapy.spider import BaseSpider
from shikari.items import ShikariItem

class Radiate (BaseSpider) :
  name = "sss"
  download_delay = 3
  concurrent_requests = 1
  allowed_domains = ["website.com"]
  start_urls = ['http://www.website.com/1',
                'http://www.website.com/2']

  def parse(self, response) :
    sel = Selector (response)
    item = ShikariItem ()
    item['Heading'] = str (sel.xpath ('//h1/text()').extract ())
    item['Source_Website'] = 
    return item

Tags： from import com http source response www website

1条回答

网友

1楼 · 发布于 2024-10-04 05:30:29

使用response.url如下所示：

item['Source_Website'] = response.url

如何将start_url添加为项目？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将start_url添加为项目？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >