Python请求通过HTTPS tunn获取数据

2024-06-01 09:49:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我当前正在从https://www3.bcb.gov.br/expectativas/publico/en/serieestatisticas的公共序列数据中提取数据

我相信这是一个使用apachewicket的公共页面。在

我通常都可以刮擦,不管是收到还是邮寄。在这里,我和我的同事陷入困境。有谁能帮助理解实际发出请求需要使用什么URL吗。到目前为止,我得到的是:

输入的表单: enter image description here

手动执行的小提琴手捕捉: enter image description here

文本视图: form19_hf_0=&;indicator=0&calculo=0&linhaPeriodicidade%3Aperiodicidade=0&tfDataInicial=11%2F10%2F2015&tfDataFinal=11%2F24%2F2015&divPeriodOrefereStatisticas%3agrupoanorereferencia%3aanReferenceIncial=16&divPeriodReferenceStatisticas%3AgrupoanReferenceFinal=16&btnCSV=Generate+CSV

我在请求中传递的表单数据: enter image description here

小结:

我需要一些帮助,我似乎不能让这篇文章正常工作,它需要我到另一个页面,我不确定如何完成这篇文章。在

NB:我想拿回一个CSV。在

我使用的库主要是请求(我本来打算用LXML,但我不认为它在这里适用)。在

我一直在和邮递员和小提琴手一起找出正确的表格,以了解要求是什么。在


Tags: csv数据httpsbr表单页面engov
1条回答
网友
1楼 · 发布于 2024-06-01 09:49:46

所以

对此的解决办法有些间接。我们不能直接发表文章,因为页面以一种通常无法预测的方式增加了实际的POST url。在

我们使用的解决方案是安装Selenium web驱动程序,并使用它模拟下拉式可见值和按钮单击。在

结果很清楚。在

谢谢还有其他可能有类似问题的人。在

相关问题 更多 >