从网站获得图像

2024-10-01 09:27:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试为calibre改进recipe,并用当前报纸的封面图像替换默认的封面图像。在

方法与get_cover_urllink)有关。在

有两个问题:

  1. 封面图片的网址每天都在变化。在
  2. 我对python几乎一无所知。在

我希望有这样的解决方案(在伪代码中):

OPEN URL "http://epaper.derstandarddigital.at/";
coverElement = (SEARCH HTML-ELEMENT "<img>" WITH ID "imgPage2" AND CLASS "page");
coverUrl = (GET HTML-ATTRIBUTE "src" FROM coverElement);
RETURN coverUrl;

有没有一种方法可以用python*)(只使用python标准库)实现这一点?在

*)优秀的方法似乎是python代码

[编辑] 下面是我的一个朋友提供的解决方案:

^{pr2}$

Tags: 方法代码图像urlgethtmllinkrecipe
1条回答
网友
1楼 · 发布于 2024-10-01 09:27:19

您可以使用lxml库从HTML文档中提取元素。基本框架如下:

import urllib
import lxml.html

fd = urllib.urlopen('http://epaper.derstandarddigital.at/')
doc = lxml.html.parse(fd)
matches = doc.xpath('//img[@id="imgPage2]')
if matches:
  print matches[0].get('src')

…但是,您提供的URL实际上并没有生成带有任何<img>标记的文档。它几乎完全是一堆Javascript。在

相关问题 更多 >