擅长:python、mysql、java
<p>据我所知,贪婪从正则表达式的开始就起作用,也就是说,它找到<code><a href="</code>,然后不贪婪就停止在<strong>第一个</strong><code>" class="nextpostslink"></code>,而不是像贪婪版本那样的<strong>最后一个</strong>。在</p>
<p>您最好在此处使用<a href="http://www.crummy.com/software/BeautifulSoup/" rel="nofollow">BeautifulSoup</a>:</p>
<pre><code>from bs4 import BeautifulSoup as BS
soup = BS(html)
print soup.find("a", "nextpostslink").attrs['href']
# returns u'http://cinemassacre.com/category/avgn/page/2/'
</code></pre>