我想用一个脚本得到所有这些图片在这个网站。我用chrome开发工具查看了主页的源代码。这些图像URL类似于
src="http://img.hb.aicdn.com/3e32a8b101e515b9e7dbe8f5a2e47afff5ec6bcf4e4a-OTvsuu_fw192
但如果我使用wget
或curl
来下载此页面,甚至在浏览器中“Save pave”,则该html文件中没有这样的链接。我不知道如何获得所有这些链接。另一个问题是如果我们向下滚动页面,图像就会连续出现。我不知道有没有办法把整页都翻出来。
Tags:
你能把网址贴到最后一页,你想在那里加载所有图片吗?在
或者你的意思是所有来自http://huaban.com/登录页的图片?在
使用以下代码,您可以将图像url“保存”到文件系统上的文件中:
但要检索图像的“源”路径。。。我担心它们将由javascript组件生成,因此您没有太多选择。在
也许一个解决方案可以是使用无头浏览器(headless browser)或JavaScript引擎桥,比如Python-Spidermonkey来获得最终的(js构建的)html内容。在
-科林-
相关问题 更多 >
编程相关推荐