如何使用selenium/beautiful soup或类似的方法解析这个链接中的表?

2024-09-30 00:27:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图分析此表上的数据:

https://www.rad.cvm.gov.br/enetconsulta/frmGerenciaPaginaFRE.aspx?CodigoTipoInstituicao=1&NumeroSequencialDocumento=62733

您会注意到这是一个动态生成的表(显然是javascript)。似乎在某种程度上,当我使用selenium或beautiful soup打开url时,它不可能识别/解析表,尽管表在那里(如果您右键单击表并检查frame source/page source,您会发现它们似乎不相关)。在

如果你能用python解析这个表,请告诉我。在


Tags: 数据httpsbrsourcewww动态javascriptgov
1条回答
网友
1楼 · 发布于 2024-09-30 00:27:46

您可以使用selenium或任何其他库来执行此操作,一旦查看源代码,就会发现表被加载到iframe中,并且从javascript设置的帧url是:

urlFrame = "https://www.rad.cvm.gov.br/enetconsulta/frmDemonstracaoFinanceiraITR.aspx?Informacao=2&Demonstracao=4&Periodo=0&Grupo=DFs+Consolidadas&Quadro=Demonstra%C3%A7%C3%A3o+do+Resultado&NomeTipoDocumento=DFP&Titulo=Demonstra%C3%A7%C3%A3o%20do%20Resultado&Empresa=VALE%20S.A.&DataReferencia=31/12/2016&Versao=1&CodTipoDocumento=4&NumeroSequencialDocumento=62733&NumeroSequencialRegistroCvm=1789&CodigoTipoInstituicao=1"

但是看起来这个url需要一些浏览器自动发送的cookies,所以我们首先加载原始url,然后直接转到frameurl并从表中提取数据。在

硒溶液:

^{pr2}$

相关问题 更多 >

    热门问题