理解谷歌的HTML

2024-09-27 21:30:46 发布

您现在位置:Python中文网/ 问答频道 /正文

第一次在这里张贴海报

我刚刚开始学习python和一般的编码,我正在研究请求和BeutifulSoup库。我试图从谷歌图片中获取图片url。当在chrome中检查站点时,我可以找到“div”和正确的imgsrc url。但是当我打开“requests”给我的HTML时,我可以找到相同的“div”,但是img src url是完全不同的,如果使用,只会导致一个黑色页面

Img of the HTML requests get

Img of the HTML found in chrome's inspect tool

我想知道的是,我想了解的是:

  1. 为什么这些HTML不同
  2. 如何获取通过带有请求的inspect工具找到的img src

希望问题有意义,并提前感谢您的帮助


Tags: ofthedivsrcurl编码imghtml
2条回答

简单地说,您的代码检索单个HTML页面,并允许您在检索时访问它。另一方面,浏览器检索HTML,然后让嵌入(或链接)其中的脚本运行,这些脚本通常对HTML(也称为DOM-Document对象模型)进行重大修改。浏览器的检查器检查完全修改的DOM

  1. 也许响应HTML和chrome inspector中的代码之间的差异是为了在JS更改页面时更新页面。例如,当您使用innerHTML()编辑div元素时,您添加的代码将添加到DOM堆栈中,与检查器中的代码一样,但不会影响响应

  2. 您可以在begging中搜索http://,最后搜索.png.jpg或任何其他图像格式

相关问题 更多 >

    热门问题