如何抓取图像链接Python和beautifulsoup

2024-06-02 11:41:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在使用Python3.7和bs4对一个网页(https://www.getyourguide.de/s/?q=tokio&customerSearch=1&searchSource=2)进行爬网,以便收集各自活动的图像

我发现链接位于html源代码中,如下所示:

<div class="activity-card-image container">                                                                                                         
<img class="" data-src="https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg" data-role="cover" alt="tokio skytreeticket" src="https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg">                                                                                       

但是经过几次试验,这个“https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg”从未出现

到目前为止,我的逻辑如下:

for reg in RegionIDArray:
    r = requests.get("https://www.getyourguide.de/-l" +str(reg) +"/")
    soup = BeautifulSoup(r.content, "lxml")


    g_data3 = soup.find_all("div",{"class": "activity-card-image-container"})
    for item in g_data3:
        print(item.get("scr"))

输出:

  None
  None
  None
  None

你们能帮我放一把吗?任何反馈都将不胜感激


Tags: httpsdivcomnoneimgwwwdecdn