从Mechaniz中的HTTPError恢复

解决方案（感谢下面的karnesJ.R）：

下面的一个很好的解决方案使用了优秀的requests库（docshere）。requests具有填写表单并通过post或get提交的功能，这很重要的是不会改变br对象的状态。在

一个excellent website允许我们测试各种错误代码，并且在顶部有一个表单接口，我已经在上面测试过了。我在这个站点创建了一个br对象，然后定义了一个从br中选择表单的函数，提取相关信息，但是通过requests提交-这样br对象没有改变并且可以重用。错误代码导致requests返回垃圾，但不会使br不可用。在

如下文所述，这需要更多的设置时间，但非常值得。在

import mechanize import requests def testErrorCodes(br,theCodes): for x in theCodes: br.select_form(nr=0) theAction = br.action payload = {'code': x} response = requests.post(theAction, data=payload) print response.status_code br=mechanize.Browser() br.set_handle_robots(False) response = br.open("http://savanttools.com/test-http-status-codes") testErrorCodes(br,[401,402,403,404,500,503,504]) # Prints the error codes testErrorCodes(br,[404]) # The browser is still alive and well to be used again!

2条回答

网友

1楼 · 编辑于 2024-09-30 22:12:55

我假设你想要提交，即使它需要多次尝试。在

我所想到的解决方案肯定是没有效率的，但它应该是有效的。在

def do_something_in_mechanize():
    <...insert your code here...>
    try:
        browser.submit()
        <...rest of your code...>
    except mechanize.HTTPError:
        do_something_in_mechanize()

基本上，它将调用函数，直到在没有HTTPErrors的情况下执行操作

网友

2楼 · 编辑于 2024-09-30 22:12:55

我已经有一段时间没有为python编写代码了，但是我想我有一个解决您的问题的方法。试试这个方法：

import requests
except Mechanize.HTTPError:
    while true: ## DANGER ##
        ## You will need to format and/or decode the POST for your form
        response = requests.post('http://yourwebsite.com/formlink', data=None, json=None)
        ## If the server will accept JSON formatting, this becomes trivial
        if response.status_code == accepted_code: break

您可以找到关于requests库here的文档。我个人认为requests比mechanize更适合你的情况。。。但这确实需要您增加一些开销，因为您需要在浏览器中使用某种RESTful拦截器来分解原始POST的提交。在

但最终，通过传入br，您将自己限制在mechanize处理br.submit()上的浏览器状态的方式。在

解决方案（感谢下面的karnesJ.R）：

相关问题更多 >

编程相关推荐

热门问题

热门文章