擅长:python、mysql、java
<ol>
<li><p>regexp的所有实现都有细微差别。它在expresso中工作并不意味着它可以在Python中工作。这也可能是一个有不同标志默认值的问题,比如空白等。</p></li>
<li><p>不要使用regexp来匹配HTML或XML,除非情况很简单。使用为HTML/XML设计的库,如<a href="http://pypi.python.org/pypi/lxml" rel="nofollow">lxml</a>或{a2}。</p></li>
<li><p>我只是想弄清楚你头痛的原因。见2。</p></li>
<li><p>当您这样做时:<code>\\></code>您将创建一个反斜杠和一个大于号的括号。regexp将其解释为文本括号。您需要三个反斜杠:<code>\\\></code>,或者更好:使用原始字符串,即使用r''而不是''。</p></li>
<li><p>使用BeautifulSoup。真正地。</p></li>
</ol>