无法使用python动态键值对/模糊js代码解析登录网页

import requests from bs4 import BeautifulSoup # all cookies received will be stored in the session object s = requests.Session() headers = { 'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:80.0) Gecko/20100101 Firefox/80.0', 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8', 'Accept-Language': 'en-US,en;q=0.5', 'Content-Type': 'application/x-www-form-urlencoded', 'Origin': 'https://student.cc.uoc.gr', 'DNT': '1', 'Connection': 'keep-alive', 'Referer': 'https://student.cc.uoc.gr/login.asp?mnuID=student&autologoff=1', 'Upgrade-Insecure-Requests': '1', } data = { 'userName': '*****', 'pwd': '*****', 'submit1': '%C5%DF%F3%EF%E4%EF%F2', 'loginTrue': 'login', } # Add headers in session. s.headers.update(headers) page = s.get('https://student.cc.uoc.gr') login = s.post('https://student.cc.uoc.gr/login.asp', data=data) home_page = s.get("https://student.cc.uoc.gr/studentMain.asp") target = s.get("https://student.cc.uoc.gr/stud_CResults.asp") soup = BeautifulSoup(target.content,"lxml", from_encoding='utf8') print(soup.text)

1条回答

网友

1楼 · 发布于 2024-06-28 20:05:35

有一个aditionnal参数，它是通过在jsfuck中加载的脚本动态加载的。您需要解码该字符串。在JS中解码很简单，但需要python中的库，有this python project，但也可以在nodejs（从this）中生成一个小脚本：

"use strict"

function decode(src) {
    if (src.length > 0) {
        var l = ''
        if (src.length > 3 && src.slice(src.length-3) == ')()'){
            var s = src.slice(0, src.length - 2)
            var i = s.length
            while (i ) {
                l = s.slice(i)
                if (l.split(')').length == l.split('(').length) {
                    break;
                }
            }
        }
        else {
            l = src;
        }
        var result = eval(l);
        return result
    }
    return "";
}

if (process.argv.length <= 2){
    console.log("input required");
    return;
}
var args = process.argv.slice(2);

console.log(decode(args[0]))

然后你可以像这样使用它：

node unjsfuck.js '[][(![]+[])[+[]]+([![].........)'

并从python脚本使用subprocess使用它，该脚本的值不带eval(...)附件

假设您已将unjsfuck.js上一个文件保存在同一位置，那么以下脚本应该可以工作：

import requests 
from bs4 import BeautifulSoup 
import subprocess
import re

s = requests.Session() 
r = s.get("https://student.cc.uoc.gr/login.asp")
soup = BeautifulSoup(r.content, "lxml")

jsfuck = [ t.text for t in soup.find_all("script") if t.text.startswith("eval")][0]

result = subprocess.run(['node', 'unjsfuck.js', jsfuck[5:-2]], stdout=subprocess.PIPE)
decoded = result.stdout.decode("utf-8")

token_name = re.search('\'name\'\s*,\s*\'(\w*)\'', decoded).group(1)
token_value = re.search('\'value\'\s*,\s*\'(\w*)\'', decoded).group(1)

form = soup.find("form")
payload = dict([
  (t["name"], t.get("value")) for t in form.find_all("input")
])
payload[token_name] = token_value
payload["userName"] = "your username here"
payload["pwd"] = "your password here"

print(payload)

r = s.post("https://student.cc.uoc.gr/login.asp", data = payload)

print(r.text)

如果仍然失败，您可能需要像脚本中建议的那样添加一些标题

这个解决方案不是很理想，因为它依赖于外部脚本（nodejs或其他jsfuck解码器）。按照t.m.adam的建议使用硒将是一个很好的解决方案

相关问题更多 >

编程相关推荐

热门问题

热门文章