网络抓取,网址跳转阻止授权?

2024-10-01 15:32:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在努力搜刮这个网站(www.dearedu.com),特别是,我在登录时遇到了巨大的困难…我尝试了在以前回答的stack exchange授权问题上所能找到的一切

目前,我正在使用请求会话登录,使用以下代码

    cj = cookielib.CookieJar()

    mySession = requests.session()
    mySession.headers.update({'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36'})


    data = mySession.get('http://www.dearedu.com/', cookies = cj)


    data= {'userid': myusername, 'pwd': mypassword,
    'fmdo': 'login', 'dopost': 'login',
    'keeptime': '604800', 'teshu': 't'}

    data = mySession.post('http://club.dearedu.com/member/index_do.php', data=data)

当上面的代码使用正确的密码和用户名运行时,您将得到以下html

<head>
<title>第二教育网提示信息</title> 
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<base target='_self'/>
<style>div{line-height:160%;}</style></head>
<body leftmargin='0' topmargin='0' bgcolor='#FFFFFF'>
<center>
<script>
      var pgo=0;
      function JumpUrl(){
        if(pgo==0){ location='http://www.dearedu.com'; pgo=1; }
      }
document.write("<br /><div style='width:450px;padding:0px;border:1px 
solid #DADADA;'><div style='padding:6px;font-size:12px;border-
bottom:1px solid #DADADA;background:#DBEEBD 
url(/plus/img/wbg.gif)';'><b>第二教育网提示信息!</b></div>");
document.write("<div style='height:130px;font-
size:10pt;background:#ffffff'><br />");
document.write("成功登录,现在转向系统主页...");
document.write("<br /><a href='http://www.dearedu.com'>如果你的浏览器没
反应,请点击这里...</a><br/></div>");
setTimeout('JumpUrl()',1000);</script>
</center>
</body>
</html>

我不明白的是,收到的cookies和状态码表明我已成功登录,但当我尝试访问主页时,它表明我没有成功登录

如果非要我猜的话,那就是它和网址跳转有关。具体来说,网站会等待一秒钟左右,然后再将您重定向到主页

有人能解释一下什么是错的,怎么解决吗?谢谢你

编辑:

““成功登录,现在转向系统主页" = 已成功登录,正在重定向到主页 "如果你的浏览器没反应,请点击这里" = 如果您的浏览器没有响应,请单击此处

其余的我不认为是相关的。谢谢


Tags: brdivcomhttpdatastylehtmlwww

热门问题