我尝试为calibre改进recipe,并用当前报纸的封面图像替换默认的封面图像。在
方法与get_cover_url
(link)有关。在
有两个问题:
我希望有这样的解决方案(在伪代码中):
OPEN URL "http://epaper.derstandarddigital.at/";
coverElement = (SEARCH HTML-ELEMENT "<img>" WITH ID "imgPage2" AND CLASS "page");
coverUrl = (GET HTML-ATTRIBUTE "src" FROM coverElement);
RETURN coverUrl;
有没有一种方法可以用python*)(只使用python标准库)实现这一点?在
*)优秀的方法似乎是python代码
[编辑] 下面是我的一个朋友提供的解决方案:
^{pr2}$
您可以使用
lxml
库从HTML文档中提取元素。基本框架如下:…但是,您提供的URL实际上并没有生成带有任何
<img>
标记的文档。它几乎完全是一堆Javascript。在相关问题 更多 >
编程相关推荐