使用BeautifulSoup和requests如何爬取受密码保护的网站

import r import requests def Login(): scrape_url = 'https://www.ecoledirecte.com/Eleves/3668/Notes' login_url = 'https://www.ecoledirecte.com/login' payload = { 'username': '***', 'password': '***' } with requests.Session() as session: post = session.post(login_url, data=payload) r = session.get(scrape_url) print(r.text)

1条回答

网友

1楼 · 发布于 2024-10-01 07:27:52

当你访问网站时，你需要模仿你的浏览器在做什么。如果您尝试在浏览器的开发工具（instructions for Chrome）中登录并打开网络监视器，您会看到位于https://www.ecoledirecte.com/login的页面只包含表单，这不是您要发布到的URL。在

相反，当您输入用户名时，浏览器会向https://api.ecoledirecte.com/v3/login.awp发送一个POST请求，其中包含

data={
    "identifiant": "username",
    "motdepasse": "pass"
}

因此，您应该将登录代码更改为：

^{pr2}$

编程相关推荐

使用hibernate OGM为mongoDB启用java SSL
java需要帮助/无法重载泛型方法
正在播放ArrayList的Java cast<Map>
带有JavaScript接口的java Webview
java JavaFx TableView多光标编辑
java继承和对象创建
如何在Eclipse中设置AWS java项目？
Javaservlet不加载jsp
java为什么startService（）和bindService（）仅在活动的onStart（）方法中使用时才起作用？
java为什么JSP页面编码指令应该是JSP中的第一行？

相关问题更多 >

编程相关推荐

热门问题

热门文章