我想用Python加载this page中的图像列表。但是,当我在浏览器(Chrome或Safari)中打开页面并打开开发工具时,检查器返回的图像列表为<img class="grid-item--image">...
。你知道吗
然而,当我尝试用Python解析它时,结果似乎不同。具体地说,我得到的图像列表是<img class="carousel--image"...>
,而soup.findAll("img", "grid-item--image")
确实返回了一个空列表。另外,我尝试用它的srcset
标记保存那些图像,大多数保存的图像不是那些在web上列出的图像。你知道吗
我认为网页在渲染时使用了某种技术。如何成功解析网页?你知道吗
我在python3.5上使用了beautifulsoup4。我加载的页面如下:
import requests
from bs4 import BeautifulSoup
html = requests.get(url).text
soup = BeautifulSoup(html, "html.parser", from_encoding="utf-8")
return soup
最好使用
selenium
这样的方法,如下所示:这将显示以下类型的输出:
这允许在浏览器中进行页面的完整呈现,然后可以获得结果HTML。你知道吗
相关问题 更多 >
编程相关推荐