擅长:python、mysql、java
<p>您可以使用一个简单的<a href="https://docs.python.org/2/library/re.html" rel="nofollow">regular expression</a>:</p>
<pre><code>import re
print re.findall(r'<h1>(.*?)</h1>', myString)
</code></pre>
<p>另一种方法是使用Beautiful Soup作为HTML解析器(如果您想解析真实的HTML页面,这是更可取的方法):</p>
^{2}$
<p><a href="http://www.crummy.com/software/BeautifulSoup/" rel="nofollow">BeautifulSoup</a>未包含在标准库中,因此需要手动安装。您可以通过pip轻松安装:</p>
<pre><code>pip install beautifulsoup4
</code></pre>