擅长:python、mysql、java
<p>问题如下:</p>
<pre><code>link = one_a_tag['href']
print(link)
</code></pre>
<p>这将返回一个链接:<code>https://data.toerismevlaanderen.be/</code></p>
<p>然后通过执行以下操作将此<code>link</code>添加到<code>download_url</code>:</p>
<pre><code>download_url = 'https://data.toerismevlaanderen.be/'+ link
</code></pre>
<p>因此,如果你<code>print(download_url)</code>,你会得到:</p>
<pre><code>https://data.toerismevlaanderen.be/https://data.toerismevlaanderen.be/
</code></pre>
<p>它不是有效的url。你知道吗</p>
<p><strong>根据评论更新</p>
<p>问题是,在你所抓取的文本中没有<code>tourist/activities/breweries</code>。
如果你写:</p>
<pre><code>for link in soup.findAll('a'):
print(link.get('href'))
</code></pre>
<p>你可以看到所有的a href标签。没有包含<code>tourist/activities/breweries</code></p>
<p><strong>但是</strong>
如果您只需要链接<code>data.toerismevlaanderen.be/tourist/activities/breweries</code>,可以执行以下操作:</p>
<pre><code>download_url = link + "tourist/activities/breweries"
</code></pre>