擅长:python、mysql、java
<p>明确地用<code>lxml</code>来代替。像这样:</p>
<pre><code>from lxml import etree
f = StringIO(your_html_text)
tree = etree.parse(f)
what_you_are_looking_for = tree.xpath('//*[contains(concat(' ', @class, ' '), ' movies')]')
</code></pre>
<p>这是一种非常健壮的获取所需数据的方法,它比正则表达式更能忍受混乱的生活(html中缺少标记、数据四处移动等)。你知道吗</p>
<p>您可以阅读更多关于它的信息<a href="http://lxml.de/xpathxslt.html" rel="nofollow">here</a>。干杯!你知道吗</p>