爬取图片链接的困难

start_urls = [ "https://www.ebay-kleinanzeigen.de/s-haus-kaufen/anzeige:angebote/c208" ] def parse(self, response): items = KleinanzeigenItem() jede_immobilie = response.css("li.ad-listitem.lazyload-item") for immobilie in jede_immobilie: title = immobilie.css("a.ellipsis::text").extract() preis = immobilie.css("aditem-main, strong::text").extract() quadratmeter = immobilie.css(".tag-small:nth-child(1)::text").extract() description = immobilie.css(".text-module-begin+ p::text").extract() image = immobilie.css("div.srpimagebox, img::attr(src)").extract() link_immobilie = immobilie.css("a.ellipsis").xpath("@href").extract() items["title"] = title items["preis"] = preis items["quadratmeter"] = quadratmeter items["description"] = description items["image"] = image items["link_immobilie"] = "https://www.ebay-kleinanzeigen.de"+link_immobilie[0] yield items

{[...] 'image': ['<div class="imagebox srpimagebox" ' 'data-href="/s-anzeige/einfamilienhaus-freistehend-in-zentraler-lage/1252437848-208-7416" ' 'data-imgsrc="https://i.ebayimg.com/00/s/MTIwMFgxNjAw/z/CBYAAOSwWI1dyD6R/$_2.JPG" ' 'data-imgsrcretina="https://i.ebayimg.com/00/s/MTIwMFgxNjAw/z/CBYAAOSwWI1dyD6R/$_35.JPG ' '2x" data-imgtitle="Einfamilienhaus freistehend in zentraler Lage ' 'Bayern - Großostheim Vorschau">\n' ' </div>'], [...]}

1条回答

网友

1楼 · 发布于 2024-10-02 18:14:59

图像的链接位于所选div元素的两个属性中。即-@data imgsrcretina和@data imgsrc。那么，你为什么不从那里挑选呢

例如，下面的xpath适合我

>> image = immobilie.css("div.srpimagebox").xpath("@data-imgsrc").extract()
>> image = immobilie.css("div.srpimagebox").xpath("@data-imgsrcretina").extract() 
# take either of the above.

输出-

>> image
 [u'https://i.ebayimg.com/00/s/MTAyNFg3Njg=/z/IDUAAOSwimZdcQuw/$_2.JPG']

相关问题更多 >

编程相关推荐

热门问题

热门文章