如何下载此网站中的所有图片:花板网

2024-10-01 04:44:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用一个脚本得到所有这些图片在这个网站。我用chrome开发工具查看了主页的源代码。这些图像URL类似于

src="http://img.hb.aicdn.com/3e32a8b101e515b9e7dbe8f5a2e47afff5ec6bcf4e4a-OTvsuu_fw192

但如果我使用wgetcurl来下载此页面,甚至在浏览器中“Save pave”,则该html文件中没有这样的链接。我不知道如何获得所有这些链接。另一个问题是如果我们向下滚动页面,图像就会连续出现。我不知道有没有办法把整页都翻出来。


Tags: 图像src脚本httpurlimg源代码网站
1条回答
网友
1楼 · 发布于 2024-10-01 04:44:44

你能把网址贴到最后一页,你想在那里加载所有图片吗?在

或者你的意思是所有来自http://huaban.com/登录页的图片?在

使用以下代码,您可以将图像url“保存”到文件系统上的文件中:

image_path = 'http://img.hb.aicdn.com/3e32a8b101e515b9e7dbe8f5a2e47afff5ec6bcf4e4a-OTvsuu_fw192'
with open(r'<path_to_file>.jpg', 'wb') as image:
    image.write(urllib2.urlopen(image_path).read())

但要检索图像的“源”路径。。。我担心它们将由javascript组件生成,因此您没有太多选择。在

也许一个解决方案可以是使用无头浏览器(headless browser)或JavaScript引擎桥,比如Python-Spidermonkey来获得最终的(js构建的)html内容。在

-科林-

相关问题 更多 >