我目前正在使用Python3.7和bs4对一个网页(https://www.getyourguide.de/s/?q=tokio&customerSearch=1&searchSource=2)进行爬网,以便收集各自活动的图像
我发现链接位于html源代码中,如下所示:
<div class="activity-card-image container">
<img class="" data-src="https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg" data-role="cover" alt="tokio skytreeticket" src="https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg">
但是经过几次试验,这个“https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg”从未出现
到目前为止,我的逻辑如下:
for reg in RegionIDArray:
r = requests.get("https://www.getyourguide.de/-l" +str(reg) +"/")
soup = BeautifulSoup(r.content, "lxml")
g_data3 = soup.find_all("div",{"class": "activity-card-image-container"})
for item in g_data3:
print(item.get("scr"))
输出:
None
None
None
None
你们能帮我放一把吗?任何反馈都将不胜感激
目前没有回答
相关问题 更多 >
编程相关推荐