我正在寻找一种方法,从不同的网页下载文件,并得到他们存储在一个特定的文件夹在本地机器。我使用的是python2.7
请参见下面的字段:
编辑
以下是html内容:
<input type="hidden" name="supplier.orgProfiles(1152444).location.locationPurposes().extendedAttributes(Upload_RFI_Form).value.filename" value="Screenshot.docx">
<a style="display:inline; position:relative;" href="
/aems/file/filegetrevision.do?fileEntityId=8120070&cs=LU31NT9us5P9Pvkb1BrtdwaCrEraskiCJcY6E2ucP5s.xyz">
Screenshot.docx
</a>
我刚试过的一种可能性是:使用html内容if add,比如https://xyz.test.com
,然后构造如下所示的URL
然后把这个URL放到浏览器上,点击Enter
,这样我就有机会下载屏幕截图中提到的文件。但是现在我们能找到这样的aems/file/filegetrevision.do?fileEntityId=8120070&cs=LU31NT9us5P9Pvkb1BrtdwaCrEraskiCJcY6E2ucP5s.xyz
值,它有多少个?在
编码我到现在为止所尝试的
只可惜怎么下载那个文件。使用脚本构造的URL:
^{pr2}$请帮帮我!在
如果你们需要我的信息,请告诉我,我很乐意与你们分享。在
提前谢谢!在
我们不知道你的第一张图片是从哪家公司获得的,但我们假设它是在某个网站上的,可能是贵公司内部的网站。在
您可以尝试的最简单的方法是使用urllib.urlretrieve根据其URL“获取”文件。如果可以右键单击该页上的链接,复制URL并将其粘贴到代码中,则可以执行此操作。在
但是,这可能行不通,例如,如果在访问该页面之前需要复杂的身份验证。用户可能需要输入密码来控制登录名。如果你走得那么远,你应该把它作为一个单独的问题发表。在
正如@JohnZwinck建议的那样,您可以使用
urllib.urlretrieve
并使用re
模块在给定页面上创建一个链接列表并下载每个文件。下面是一个例子。在您可以根据需要更改},并将脚本另存为
^{pr2}$base_url
和{download.py
。然后从终端使用它相关问题 更多 >
编程相关推荐