从不同领域提取鱼糜中的元素

2024-06-01 06:16:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我是新来刮,并试图从我的供应商网站刮一些图片。你知道吗

这是HTML代码:

<div class="image-additional caruofredsel-additional">
  <a href="http://scssports.in/image/cache/data/adidas-t-t-husgado-white-unisex-sports-shoes-g40422-500x500.jpg" title="Adidas T T Husgado Badminton and Squash Shoes" class="colorbox" rel="colorbox"><img class="fade-image" 
src="http://scssports.in/image/cache/data/adidas-t-t-husgado-white-unisex-sports-shoes-g40422-80x80.jpg" title="Adidas T T Husgado Badminton and Squash Shoes" alt="Adidas T T Husgado Badminton and Squash Shoes" />
</a>

如您所见,这里有两个图像url。我在中创建了两个不同的字段项目.py文件,即imgurl1和imgurl2,因为我希望这两个不同的图像在导出到csv时存储在不同的列下。你知道吗

我有什么办法可以这样做吗?你知道吗

我的代码:

titles = hxs.select("//div[@class='image-additional caruofredsel-additional']")
      items = []
      for titles in titles:
            item = SampleItem()
            item ["imgurl2"] = titles.select("a/@href").extract()
            items.append(item)

谢谢!你知道吗


Tags: and代码inimagedivitemsquashclass
1条回答
网友
1楼 · 发布于 2024-06-01 06:16:53

因为<img>标记在<a>标记内,所以应该可以这样做

item ["imgurl1"] = titles.select("a/img/@src").extract()

相关问题 更多 >