<pre><code>def parsehttp(url):
r = urllib.request.urlopen(url).read()
soup = BeautifulSoup(r, 'lxml')
for link in soup.find_all('a'):
href = link.attrs.get("href")
print(href)
</code></pre>
<p>我想能够提取所有传出链接从一个网站,然而,我现在的代码是返回两个相对链接和传出链接,我只希望传出链接。区别在于传出链接中包含https部分,而相对链接则不包含https部分。我还想获得的'标题'部分,每个链接以及</p>