擅长:python、mysql、java
<p>你打错了斜杠:</p>
<pre><code>regex='<title>(.+?)<\title>'
</code></pre>
<p>应该是:</p>
<pre><code>regex='<title>(.+?)</title>'
</code></pre>
<p>HTML在结束标记中使用斜杠。你知道吗</p>
<p>也就是说,不要使用正则表达式来解析HTML。用这样的表达式匹配HTML会变得太复杂,太快。你知道吗</p>
<p>相反,使用HTML解析器,Python有几种方法可供选择。我建议您使用<a href="http://www.crummy.com/software/BeautifulSoup/" rel="nofollow">BeautifulSoup</a>,这是一个流行的第三方库。你知道吗</p>
<p>BeautifulSoup示例:</p>
<pre><code>from bs4 import BeautifulSoup
response = urllib.urlopen(url)
soup = BeautifulSoup(response.read(), from_encoding=response.info().getparam('charset'))
title = soup.find('title').text
</code></pre>