擅长:python、mysql、java
<p>正则表达式<code><td.*?>(.*?)<\/td></code>就可以了。在</p>
<p>但是我可以推荐您使用<a href="http://docs.python.org/2/library/htmlparser.html" rel="nofollow">HTMLParser Module</a>或{a2}</p>
<p>我花了点时间给您写了另一个使用HTMLParser的示例:</p>
<pre><code>from HTMLParser import HTMLParser
class TDExtractor(HTMLParser):
def handle_starttag(self, tag, attrs):
if tag == 'td':
self.recording = True
def handle_endtag(self, tag):
if tag == 'td':
self.recording = False
def handle_data(self, data):
if self.recording:
self.data.append(data)
def reset(self):
HTMLParser.reset(self)
self.data = []
self.recording = False
</code></pre>
<p>在行动中:</p>
^{pr2}$