处理空url破坏xml解析循环

for i in range(0, 20855): urlb = str(i) url = urla + urlb trys=0 t=0 while (trys < 3): try: cfile = UR.urlopen(url) trys = 3 except urllib.error.HTTPError as e: t=t+1 print('error at '+str(time.time()-tstart)+' seconds') print('typeID = '+str(i)) print(e.code) print(e.read()) time.sleep (0.1) trys=0+t tree = ET.parse(cfile) ##parse xml file root = tree.getroot() ...do a bunch of stuff with i and the file data

2条回答

网友

1楼 · 编辑于 2024-10-01 22:27:12

你可以试试这个：

for i in range(0, 20855):
    url = '%s%d' % (urla, i)
    for trys in range(3):
        try:
            cfile = UR.urlopen(url)
            break
        except urllib.error.HTTPError as e:
            print('error at %s seconds' % (time.time()-tstart))
            print('typeID = %i'%i)
            print(e.code)
            print(e.read())
            time.sleep(0.1)
    else:
        print "retry failed 3 times"
        continue
    try:
        tree = ET.parse(cfile)   ##parse xml file
    except Exception, e:
        print "cannot read xml"
        print e
        continue
    root = tree.getroot()
    ...do a bunch of stuff with i and the file data

网友

2楼 · 编辑于 2024-10-01 22:27:12

关于“算法”问题：您可以在while主体中设置错误状态（例如last_iteration_successful = False），然后中断while主体，然后检查for主体中的错误状态，并有条件地中断for主体。你知道吗

关于体系结构：通过使用try/except块进行适当的异常处理，为可能发生的所有相关错误准备代码。定义自定义异常类型，然后手动引发它们也很有意义。引发异常会立即中断当前的控制流，它可以节省许多break

相关问题更多 >

编程相关推荐

热门问题

热门文章