我正在从使用selenium web驱动程序废弃的页面中获取图像列表。
每个页面都有n
个图像,每个图像有3个变体(thumb、hoved、full)。
所以我创建了一个列表,其中每个列表项都是包含所有3个版本图像的字典:
advert_image_dict.append({
'Image_thumb_100x75:': img,
'Image_hoved_400x300:': image_hoved,
'Image_full_800x600:': image_full})
因此,单个列表项如下所示:
print(image_dict[1])
{'Image_thumb_100x75:':
'https://cache.mysite.com/mmo/7/295/170/227_-64694801_thumb.jpg',
'Image_hoved_400x300:':
'https://cache.mysite.com/mmo/7/295/170/227_-64694801_hoved.jpg',
'Image_full_800x600:':
'https://cache.mysite.com/mmo/7/295/170/227_-64694801.jpg'}
我需要创建每个网页报废文件夹,将保存该页的所有图像。
文件夹名称的格式如下:{Page_#x}{Title of page}
每个文件夹都包含从该页面获取的图像。
图像名称的格式为:
{Title of page}{Image_#x}{image_dict[x].get('Image_thumb_100x75')}
{Title of page}{Image_#x}{image_dict[x].get('Image_hoved_400x300')}
{Title of page}{Image_#x}{image_dict[x].get('Image_full_800x600')}
{Title of page}{Image_#x+1}{image_dict[x+1].get('Image_thumb_100x75')}
{Title of page}{Image_#x+1}{image_dict[x+1].get('Image_hoved_400x300')}
{Title of page}{Image_#x+1}{image_dict[x+1].get('Image_full_800x600')}
变量ad_title
包含标题(我将删除空格和其他字符)
我会创建文件夹,每页与
path = "/test/`{Page_#x}{Title of page}"
os.mkdir(path)
并使用
urllib.urlretrieve("https://cache.mysite.com/mmo/7/295/170/227_-64694801_thumb.jpg", "{Title of page}{Image_#x}{image_dict[x].get('Image_thumb_100x75')}")
我只是不知道如何为文件夹和图像名称定义这个获取/定义名称迭代器
看起来简单的字符串格式可以在这里帮助您
要生成文件夹的名称和路径,可以使用:
要生成图像文件的名称,可以尝试:
这对你有帮助吗
相关问题 更多 >
编程相关推荐