擅长:python、mysql、java
<p>不应该使用正则表达式,而应该使用诸如beauthoulsoup之类的html解析器。您还可以将etree库与xpath一起用于复杂的用例。在</p>
<p>不过,如果你想用正则表达式-</p>
<p>正则表达式是一种特定于域的语言,它使字符串解析和处理更加容易。虽然,有些人可能不同意正则表达式提供了许多优雅的解决方案,但字符串上的循环可能永远是。-</p>
<pre><code>import re
html_string = '<span class="cd__headline-text">Is this model too thin for Yves Saint Laurent? </span>'
regex = re.compile(r'(?<=>).*(?=<)')
result = regex.findall(html_string)[0]
</code></pre>
<p>在这个正则表达式中,我使用了正则表达式的look ahead和look behind。
就学习正则表达式而言,它需要相当多的时间。我建议你去读一些关于regex的好教程或书。在</p>