Python，scrape动态PDF

1条回答

网友

1楼 · 发布于 2024-09-28 23:49:25

您的web scraper已从中识别出您的目标tab=12？？

https://www.morningstar.co.uk/uk/funds/snapshot/snapshot.aspx?id=F000011J7K&tab=12

导致5个选项卡中的第5个选项卡=14°Document.PDF

https://www.morningstar.co.uk/uk/funds/snapshot/snapshot.aspx?id=F000011J7K&tab=14&DocumentId=7967b8f6f4115dce4464b808254383b5&Format=PDF

稍后在iFrame中将其翻译为

https://doc.morningstar.com/document/7967b8f6f4115dce4464b808254383b5.msdoc/?clientid=euretailsite

我不知道您是如何从第2步处理到第3步的，但我们可以清楚地看到，如果我们将我们的目标文档ID=7967b8f6f4115dce4464b808254383b5输入到一个阅读器中要使用https://doc.morningstar.com/document/7967b8f6f4115dce4464b808254383b5.msdoc下载，我们得到

加载第1页，共100页
查找最后一个具有DocumentId的选项卡
读身份证
下载具有该ID的文档
吃-睡-读-重复

编程相关推荐

java Sonarqube测试覆盖率过滤器（jacoco）
java演示文稿将被取消，因为自创建以来显示度量已更改
java为什么Omnifaces Websocket<o:socket>不能与Websphere 9一起使用？
我试图读取java中的xml，但在我的系统中出现了一个错误
java异步支持未启用，即使默认情况下应该启用
java getThreadHandler方法无法从HandlerThread实例访问
带成员函数的多线程Java启动线程
java jar非法参数
java以编程方式注册@Component注释类
正则表达式如何在java中查找字符串中的长双精度数

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python，scrape动态PDF

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >