用javascript屏幕延迟抓取站点

2024-10-05 12:27:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试抓取一个有一瞬间javascript延迟的站点。在

我目前正在使用python进行抓取。每当我“得到”页面时,javascript延迟还没有完成,is还没有完全加载新的dom。在

我怎么才能拿到这样的pge?在


Tags: 站点is页面javascriptdompge
1条回答
网友
1楼 · 发布于 2024-10-05 12:27:58

您可以扩展Mozilla来构建一个web scraper,它可以充分利用web浏览器的功能。在加载了所有数据并构建了DOM之后,可以使用XSLT从DOM中提取所需的数据。如果DOM是在初始加载后动态更改的,您可以采取一些方法等待更改。有关详细信息,请访问http://www.gooseeker.com。GooSeeker为每个人免费发布类似的工具。大多数代码都是javascript代码,并且可读,从中可以找到它是如何运行的。在

相关问题 更多 >

    热门问题