Python链接目录不包括

2024-09-28 21:04:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我想解决一些关于urlparse.urljoin. 像这样使用这个库

urljoin('http://xxxx.yyy/directory/','file.file')

给我http://xxxx.yyy/directory/file.file但是如果我最后在url中不给斜杠

urljoin('http://xxxx.yyy/directory','file.file')

给我http://xxxx.yyy/file.file这个发行版让我编写自动收集程序。 有谁能解决这个问题吗。我试图把斜杠最后与正则表达式和替换,但这些都不能正常工作时,网址是这样完成

http://xxxx.yyy/zzzz/file.file

Tags: 程序httpurldirectoryfile网址urlparse斜杠
1条回答
网友
1楼 · 发布于 2024-09-28 21:04:36

它的行为是正确的。如果您在http://example.com/index.html上,并单击指向two.html的链接,那么您将到达http://example.com/two.html。这就是相对URL的工作方式。你知道吗

urljoin无法知道最后一个组件是否是目录。你可以试着猜测,也许可以通过寻找一个.,如果你认为斜杠应该在那里的话,只添加斜杠。你知道吗

相关问题 更多 >