擅长:python、mysql、java
<p>在检索HREF值之后,您必须进行一些额外的处理</p>
<p>您需要做的是获取源页面的基本URL路径,并附加HREF值</p>
<p>假设源页面是“https://example.com/stuff/source.html,该页面包含一个带有HREF“foo.html”的链接。您需要获取源页面的基本URL路径(即“https://example.com/stuff/“并附加HREF值以获取”https://example.com/stuff/foo.html“</p>
<p>您可以使用<code>dirname</code>函数来帮助您:</p>
<pre><code>>>> dir = os.path.dirname('https://example.com/stuff/source.html')
>>> dir
'https://example.com/stuffl'
</code></pre>
<p>然后将两部分连接在一起:</p>
<pre><code>>>> os.path.join(dir, "foo.html")
'https://example.com/stuff/foo.html'
</code></pre>