擅长:python、mysql、java
<p>我建议使用一个好的HTML解析器(例如<a href="http://www.crummy.com/software/BeautifulSoup/" rel="noreferrer">BeautifulSoup</a>——但是出于您的目的,即使用格式良好的HTML作为输入,Python标准库(如<a href="http://docs.python.org/library/htmlparser.html" rel="noreferrer">HTMLParser</a>)附带的解析器也应该可以很好地工作),而不是使用原始REs来解析HTML。在</p>
<p>如果您想继续使用原始RE方法,则模式:</p>
<pre><code>r'<div class="deg">([^<]*)</div>'
</code></pre>
<p>看起来是从字符串“<code><div class="deg">DATA</div></code>”中获取字符串“DATA”的最简单方法——假设这就是您所追求的。您可能需要在需要容忍可选空白的位置添加一个或多个<code>\s*</code>。在</p>