获取已保存网页的原始URL

2024-09-28 05:23:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用Python和lxml库解析保存的网页。在

保存网页的docinfo显示保存网页的磁盘位置。在

storedHtmlDoc.docinfo.URL

有没有办法从保存的页面中提取原始URl?在


Tags: url网页页面lxml磁盘办法docinfostoredhtmldoc
1条回答
网友
1楼 · 发布于 2024-09-28 05:23:56

如果您没有将下载页面的URL存储在某个地方,则无法使用该URL。在

如果可以控制下载过程,可以将下载页面的URL放在页面的META标记中。在

相关问题 更多 >

    热门问题