我正在使用BeautifulSoup编写一个python程序。我想做一个网页刮板,将检索有关电子期刊的信息。我使用BeautifulSoup检索html类,但它返回None或“[]”。我是一个初学者,两周前开始学习python,所以我根本不知道该做什么。。。请帮帮我
这是我的密码
from bs4 import BeautifulSoup
JAGS7_result = requests.get("https://agsjournals.onlinelibrary.wiley.com/toc/15325415/2021/69/7")
JAGS7_soup = BeautifulSoup(JAGS7_result.text, "html.parser")
results = JAGS7_soup.find_all("div",{"class": "issue-item"})
print(results)```
我还建议你在将来的工作中使用蜘蛛和刮痧。这是一个很棒的抓取包,因为beautifulsoup通常无法在JavaScript网站上成功
您的http响应未成功。它收到403个不允许的响应
检查
应该是200。你的情况是403
使用请求头来解决此问题
现在你得到了你想要的结果
在请求期间尝试设置
User-Agent
头:印刷品:
相关问题 更多 >
编程相关推荐