我想从http://imaging.occeweb.com/imaging/UIC1012_1075.aspx下载对应于“API”值列表的所有pdf文档
到目前为止,我已经成功地发布了“API”请求,但不知道下一步该怎么做。在
import requests
headers = {'User-Agent': 'Mozilla/5.0'}
url = 'http://imaging.occeweb.com/imaging/UIC1012_1075.aspx'
API = '15335187'
payload = {'txtIndex7':'1','txtIndex2': API}
session = requests.Session()
res = session.post(url,headers=headers,data=payload)
它有点复杂,您需要考虑一些额外的事件验证隐藏输入字段。为此,您首先需要获取页面,收集所有隐藏的值,为API设置值,然后通过以下HTML响应的HTML解析发出POST请求。在
幸运的是,有一个名为^{} 的工具可以帮助自动填充表单提交请求中的这些隐藏字段。下面是一个完整的解决方案,包括用于解析结果表的示例代码:
相关问题 更多 >
编程相关推荐