我正在尝试使用以下代码下载图像:
from urllib import urlretrieve
urlretrieve('http://gdimitriou.eu/wp-content/uploads/2008/04/google-image-search.jpg',
'google-image-search.jpg')
成功了。图像已下载,可由任何图像查看器软件打开。
但是,下面的代码不起作用。下载的图像只有2KB,任何图像查看器都无法打开。
from urllib import urlretrieve
urlretrieve('http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg',
'Zindagi1976.jpg')
这是HTML格式的结果。
ERROR
The requested URL could not be retrieved
While trying to retrieve the URL: http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg
The following error was encountered:
Access Denied.
Access control configuration prevents your request from being allowed at this time. Please contact your service provider if you feel this is incorrect.
Your cache administrator is nobody.
Generated Mon, 05 Dec 2011 17:19:53 GMT by sq56.wikimedia.org (squid/2.7.STABLE9)
如果使用了以下选项,则可以下载图像:
但如果你这样做了:
您可能无法下载图像。这可能是因为维基百科可能有规则(robot.txt)来拒绝机器人或机器人(未知客户端)。尝试模拟浏览器。
为此,必须将以下内容添加为标题的一部分:
您可以这样做:
这将检索文件
相关问题 更多 >
编程相关推荐