从ASX pag刮表

2024-05-19 12:37:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试清除此静态页上的表:

http://www.asx.com.au/prices/targetratetracker.htm

使用一个简单的基于UI的scraper foundhere进行测试,可以看到即使使用KeepEverythingExtractor设置,它也不会返回表。你知道吗

使用targetratetracker.htm页面上的检查器,我们可以看到以下内容:

A Parser-blocking, cross-origin script, http://www.adobetag.com/d4/v2/.../amc.js, is invoked via document.write.

我不知道使用哪种库或语言,只想知道是否有办法绕过拦截器(如果这确实是问题所在)。你知道吗


Tags: comhttpparseruiwww静态页面scraper