擅长:python、mysql、java
<p>至于第一个问题-没有href值的链接失败。所以你得到的不是一个字符串,而是<code>None</code>。你知道吗</p>
<p>以下工作:</p>
<pre><code>from BeautifulSoup import BeautifulSoup
import urllib2
import re
html_page = urllib2.urlopen('http://netflixukvsusa.netflixable.com/2016/
07/complete-alphabetical-list-k-sat-jul-9.html')
soup = BeautifulSoup(html_page)
for link in soup.findAll('a'):
link_href = link.get('href')
if link_href:
reqlink = re.search('netflix',link_href)
if reqlink:
print link_href
for link in soup.findAll('img'):
if link.get('alt') == 'UK' or link.get('alt') == 'USA':
print link.get('alt')
</code></pre>
<p>至于第二个问题,我建议在电影和它出现的国家列表之间建立一个字典,这样就可以更容易地将它格式化成你想要的字符串。你知道吗</p>