Webscraping:有些数据(图像)似乎不可用于抓取?

2024-10-03 02:33:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试从一个使用Python、Selenium和Firefox的网站上获取图像URL,但是当这不可能的时候,我会面临这样的情况吗?没有元素,但显示图像。当我在Firefox中使用“inspect”时,它为图像提供了以下元素,但是我在其中看不到任何关于图像源的内容:

<canvas width="575" height="575" id="orbitvu-2154214-obj-canvas" class="orbitvu-viewer-object-canvas zindexer" style="margin: 0px; padding: 0px; box-sizing: border-box; line-height: 0; width: 100%; height: 100%; display: block; background-color: rgb(255, 255, 255); opacity: 1;"></canvas>

我还可以看到firefox在下载web站点时会下载图像,图像下载是由嵌入在站点中的js脚本触发的。因此,我假设这个脚本在这里发挥了一些魔力——它下载图像,并以某种方式使浏览器显示它,而最终的HTML源中没有任何内容可用于标识图像源位置。 我想知道是否有一些情况下,它是根本不可能刮日期,也许这是其中之一?你知道吗


Tags: 图像脚本boxurl元素内容站点网站
1条回答
网友
1楼 · 发布于 2024-10-03 02:33:30

那不是图像,那是画布元素。Canvas用于在web页面上绘制图形,您可以在Canvas上绘制图像,但这可能是您的困惑所在。很可能是图像流下来,然后JavaScript将其绘制到画布上,查看他们的JavaScript源代码以了解更多信息,或者将url链接到我们可以查看的地方

相关问题 更多 >