我正在从谷歌抓取图片。我的脚本中有图像链接,但这个有这种格式
我打开了,这是图像,但我不能使用urllib.urlretrieve(imagenurl,imagen)进行下载
有人知道其他下载方式吗? 我正在使用python 2.7
import requests
from bs4 import BeautifulSoup
import urllib
def run():
palabra ='pez'
response = requests.get('https://www.google.com/search?q={}&hl=es&sxsrf=ALeKk00KoMQKffGLNWV5UEKbuPwpySPuig:1596391733831&source=lnms&tbm=isch&sa=X&ved=2ahUKEwiajd7Rjv3qAhXqTN8KHSINBkcQ_AUoAXoECBoQAw&biw=1262&bih=593'.format(palabra))
soup = BeautifulSoup(response.content,'html.parser')
imagenes = soup.find_all('img')
for i in range(1,5):
imagen_i = imagenes[i]['src']
imagen = imagen_i.split('/')[-1]
print(imagen_i)
#urllib.urlretrieve(imagen_i)
if __name__ == '__main__':
run()
我可以在Linux上用
urlretrieve
下载它,但是您应该检查print(imagen)
以查看您使用的文件名它的名字像
使用系统中可能不允许的字符-因此它可能不会保存它-您应该手动创建文件名-即
1.jpg
、2.jpg
、"{}.jpg".format(i)
-或者您应该从文件名中删除不允许的字符相关问题 更多 >
编程相关推荐