我想解决一些关于urlparse.urljoin. 像这样使用这个库
urljoin('http://xxxx.yyy/directory/','file.file')
给我http://xxxx.yyy/directory/file.file但是如果我最后在url中不给斜杠
urljoin('http://xxxx.yyy/directory','file.file')
给我http://xxxx.yyy/file.file这个发行版让我编写自动收集程序。 有谁能解决这个问题吗。我试图把斜杠最后与正则表达式和替换,但这些都不能正常工作时,网址是这样完成
http://xxxx.yyy/zzzz/file.file
它的行为是正确的。如果您在
http://example.com/index.html
上,并单击指向two.html
的链接,那么您将到达http://example.com/two.html
。这就是相对URL的工作方式。你知道吗urljoin
无法知道最后一个组件是否是目录。你可以试着猜测,也许可以通过寻找一个.
,如果你认为斜杠应该在那里的话,只添加斜杠。你知道吗相关问题 更多 >
编程相关推荐