擅长:python、mysql、java
<p>一个很简单的方法是获取照片的<code>alt</code>属性。这样可以得到干净的文本输出,并且只有14个文本,而不需要切片/索引。你知道吗</p>
<pre><code>from bs4 import BeautifulSoup
import requests
r = requests.get('https://www.planetware.com/tourist-attractions-/oslo-n-osl-oslo.htm')
soup = bs(r.content, 'lxml')
attractions = [item['alt'] for item in soup.select('.photo [alt]')]
print(attractions)
</code></pre>