<p>我正在解析从链接列表返回的HTML。当我在每个HTML文档中到达某一点时,我会引发一个异常。在</p>
<pre><code>import urllib2, time,
from HTMLParser import HTMLParser
class MyHTMLParser2(HTMLParser):
def handle_starttag(self, tag, attrs):
if somethings:
do somethings
if tag == "div" and "section2" in attrs[0][1]:
raise NameError('End')
parser2 = MyHTMLParser2()
cntr = 0
for links in ls:
try:
f = urllib2.urlopen(links)
parser2.feed(f.read())
cntr+=1
if cntr%10 == 0:
print "Parsing...", " It has benn", (time.clock()-start)/60, 'mins.'
break
except Exception, e:
print 'There has been an error Jim. url_check number', cntr
error_log.write(links)
continue
</code></pre>
<p>它只对第一个链接执行一次try语句,然后将exception子句执行到无穷大。在</p>
<p>一旦发生异常,我如何让它转到下一个链接</p>
<p><code>error_log</code>来自于它可能遇到的与<code>urllib2</code>有关的其他错误,大多数情况下它们似乎无法足够快地连接到网页。因此,如果有一种方法可以在不引发异常的情况下退出{<cd3>},那就太好了。这样我就可以重新实现<code>error_log</code></p>