擅长:python、mysql、java
<p>您可以<em>unescape</em>字符串,以便取回HTML标记:</p>
<pre><code>import HTMLParser
parser = HTMLParser.HTMLParser()
str = parser.unescape(str)
</code></pre>
<p>然后使用一些正则表达式删除HTML标记:</p>
<pre><code>p = re.compile(r'<.*?>')
return p.sub('', str)
</code></pre>
<p>我并不推荐使用regex来解析HTML,您可以使用<code>BeautifulSoup</code>。你知道吗</p>