我正在尝试自动从science direct下载文章 例如:
url = 'http://www.sciencedirect.com/science/article/pii/S1053811913010240'
我可以用我的浏览器毫无问题地访问这些文章,但是我尝试过使用Python的requests
、urllib2
和{
Wget也不起作用。在
例如
^{pr2}$退货:
HTTP request sent, awaiting response... 404 Not Found
有什么问题吗?在
它们可能无法工作,因为web服务器不喜欢用户代理。也许是想阻止批量下载。在
如果使用
wget
指定一个用户代理,则它可以工作。用你的例子。在这里有一些代码是我从pyscholar修改的。在
相关问题 更多 >
编程相关推荐