当页面响应时间过长时，urllib请求失败

def urlparse(urlColumnElem): try: conn = urllib.request.urlopen(urlColumnElem) except urllib.error.HTTPError as e: return (e.code) except urllib.error.URLError as e: return ('URL_Error') else: redirect=conn.geturl() #check redirect if(redirect == urlColumnElem): #print ("same: ") #print(redirect) return (redirect) else: #print("Not the same url ") return(redirect)

2条回答

网友

1楼 · 编辑于 2024-09-30 14:21:07

看看docs：

urllib.request.urlopen(url, data=None[, timeout])
The optional timeout parameter specifies a timeout in seconds for blocking operations like the connection attempt (if not specified, the global default timeout setting will be used).

您可以为您的流程设置一个实际的timeout（以秒为单位）：

conn = urllib.request.urlopen(urlColumnElem, timeout=realistic_timeout_in_seconds)

为了让代码停止压缩，请将所有内容移到try except块中：

^{pr2}$

现在，如果发生超时，您将捕获异常，程序将不会崩溃。在

祝你好运：）

网友

2楼 · 编辑于 2024-09-30 14:21:07

首先，有一个timeout参数可以用来控制urlopen允许的时间。接下来，urlopen中的超时应该只抛出一个异常，更确切地说是一个socket.timeout。如果你不想让它中止程序，你只要抓住它：

def urlparse(urlColumnElem, timeout=5):   # allow 5 seconds by default
    try:
        conn = urllib.request.urlopen(urlColumnElem, timeout = timeout)
    except urllib.error.HTTPError as e:
        return (e.code)
    except urllib.error.URLError as e:
        return ('URL_Error')
    except socket.timeout:
        return ('Timeout')
    else:
        ...

相关问题更多 >

编程相关推荐

热门问题

热门文章