Webscraping：有些数据（图像）似乎不可用于抓取？

2024-10-03 02:33:30 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试从一个使用Python、Selenium和Firefox的网站上获取图像URL，但是当这不可能的时候，我会面临这样的情况吗？没有元素，但显示图像。当我在Firefox中使用“inspect”时，它为图像提供了以下元素，但是我在其中看不到任何关于图像源的内容：

<canvas width="575" height="575" id="orbitvu-2154214-obj-canvas" class="orbitvu-viewer-object-canvas zindexer" style="margin: 0px; padding: 0px; box-sizing: border-box; line-height: 0; width: 100%; height: 100%; display: block; background-color: rgb(255, 255, 255); opacity: 1;"></canvas>

我还可以看到firefox在下载web站点时会下载图像，图像下载是由嵌入在站点中的js脚本触发的。因此，我假设这个脚本在这里发挥了一些魔力——它下载图像，并以某种方式使浏览器显示它，而最终的HTML源中没有任何内容可用于标识图像源位置。我想知道是否有一些情况下，它是根本不可能刮日期，也许这是其中之一？你知道吗

Tags：图像脚本 box url 元素内容站点网站

1条回答

网友

1楼 · 发布于 2024-10-03 02:33:30

那不是图像，那是画布元素。Canvas用于在web页面上绘制图形，您可以在Canvas上绘制图像，但这可能是您的困惑所在。很可能是图像流下来，然后JavaScript将其绘制到画布上，查看他们的JavaScript源代码以了解更多信息，或者将url链接到我们可以查看的地方

Webscraping：有些数据（图像）似乎不可用于抓取？

相关问题更多 >

编程相关推荐

热门问题

热门文章

Webscraping：有些数据（图像）似乎不可用于抓取？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >