我是新来刮,并试图从我的供应商网站刮一些图片。你知道吗
这是HTML代码:
<div class="image-additional caruofredsel-additional">
<a href="http://scssports.in/image/cache/data/adidas-t-t-husgado-white-unisex-sports-shoes-g40422-500x500.jpg" title="Adidas T T Husgado Badminton and Squash Shoes" class="colorbox" rel="colorbox"><img class="fade-image"
src="http://scssports.in/image/cache/data/adidas-t-t-husgado-white-unisex-sports-shoes-g40422-80x80.jpg" title="Adidas T T Husgado Badminton and Squash Shoes" alt="Adidas T T Husgado Badminton and Squash Shoes" />
</a>
如您所见,这里有两个图像url。我在中创建了两个不同的字段项目.py文件,即imgurl1和imgurl2,因为我希望这两个不同的图像在导出到csv时存储在不同的列下。你知道吗
我有什么办法可以这样做吗?你知道吗
我的代码:
titles = hxs.select("//div[@class='image-additional caruofredsel-additional']")
items = []
for titles in titles:
item = SampleItem()
item ["imgurl2"] = titles.select("a/@href").extract()
items.append(item)
谢谢!你知道吗
因为
<img>
标记在<a>
标记内,所以应该可以这样做相关问题 更多 >
编程相关推荐