如何使用python从html元素中提取信息

2024-10-03 15:33:14 发布

您现在位置:Python中文网/ 问答频道 /正文

我想要一个python脚本,它将从html链接元素href中提取信息。 以下是示例html代码:

<link rel="icon" href="https://scihub.copernicus.eu/dhus/odata/v1/Products('4c33088a-08e8-4422-9f3d-ed65411889ef')/Products('Quicklook')/$value"/>
<id>4c33088a-08e8-4422-9f3d-ed65411889ef</id>

href属性中的https链接是一个下载链接,我希望使用python脚本自动下载。我尝试使用selenium和请求库提取数据,但没有取得任何进展。 我能找到解决办法吗

谢谢你的回答


Tags: 代码https脚本信息id元素示例链接
1条回答
网友
1楼 · 发布于 2024-10-03 15:33:14

这篇文章可能会有所帮助 https://www.tutorialspoint.com/downloading-files-from-web-using-python 这是一个非常简单的解决方案,使用requests包获取您想要下载的网站内容。以下是本教程中的一个小示例:

import requests

url = 'https://www.facebook.com/favicon.ico'
r = requests.get(url, allow_redirects=True)
open('facebook.ico', 'wb').write(r.content)

相关问题 更多 >