我试图从这个网站上获取数据:Website link。在
我想从特定日期下载所有的PDF文件。在
虽然我已经成功地从第一页获取了文件并正确地下载了它们,但我无法更改日期,这样我就可以回到以前的日期并获得旧的pdf文件。在
我试过这句话:
scrapy.FormRequest.from_response(response,formxpath='//table//td//input[@type="text"]', formdata={'value': "20.05.2017"}, clickdata={'type':'submit'}, method='POST')
但是view(response)
总是显示当前日期。在
我不确定这是不是正确的,我是新来的刮痧,我正在努力解决问题。我认为这个方法是正确的,因为当我更改日期时,链接没有改变,所以它应该是POST
,而不是{
我有什么想法可以让它发挥作用?
我认为FormRequest()
是这里最好的选择,但是我在网上没有看到任何其他的例子,而且scrapy网站上的文档也帮不了我那么多,所以我试图研究涉及登录凭据的示例,它们都使用FormRequest.from_response()
PS:我已经包括了一个与日期更改有关的HTML代码段的屏幕截图。在
输入字段名称为“日期”,而不是“值”:
您还可以使用它的开发工具检查浏览器发送的内容:http://imgur.com/a/ztDtF(选中底部的“表单数据”)
因此,您可以使用:
^{pr2}$使用scrapy shell的示例会话,显示不同的表行:
相关问题 更多 >
编程相关推荐