网络爬虫无法获得动态生成u

2024-06-28 20:27:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在写一个玩具程序,从一个电脑上抓取一些图片网站。但是用js生成的url。任何人都可以告诉我怎么处理。。 解析的url: 你知道吗

以及原始网页: http://jandan.net/ooxx/page-323#comments

不管怎样,谢谢


Tags: 程序httpurl网页net网站pagejs
1条回答
网友
1楼 · 发布于 2024-06-28 20:27:59

图像src URI是经过编码和加密的,您需要通过b64、md5和站点自己的方法来解密'img hash'。你知道吗

遵循函数“jandon\u load\u img”并捕获其返回值“c”。你知道吗

您还可以学习selenium使用WebDriver在javascript运行后提取HTML页面。你知道吗

相关问题 更多 >