问的问题很简单,但对我来说,这不管用,我也不知道!你知道吗
我想用BeautifulSoup从这个页面https://www.brewersfriend.com/homebrew/recipe/view/16367/southern-tier-pumking-clone中获取评级啤酒,但它不起作用。你知道吗
这是我的密码:
import requests
import bs4
from bs4 import BeautifulSoup
url = 'https://www.brewersfriend.com/homebrew/recipe/view/16367/southern-tier-pumking-clone'
test_html = requests.get(url).text
soup = BeautifulSoup(test_html, "lxml")
rating = soup.findAll("span", class_="ratingValue")
rating
当我完成时,它不工作,但如果我对另一页做同样的事情就是工作。。。我不知道。有人能帮我吗?评分结果为4.58
谢谢大家!你知道吗
您请求响应的页面被禁止为403,因此您可能没有收到错误,但它将为您提供空白结果[]。为了避免这种情况,我们添加了用户代理,这段代码将得到您想要的结果。你知道吗
获取禁止状态码(HTTP错误403)背后的原因,这意味着服务器将无法满足您的请求,尽管了解响应。你一定会得到这个错误,如果你尝试刮了很多更流行的网站将有安全功能,以防止机器人。所以你需要掩饰你的要求!你知道吗
Headers
。你知道吗itemprop
使用
lxml
作为树生成器,或您选择的任何其他方法如果您打印
test_html
,您会发现得到403禁止响应。你知道吗您应该向GET请求添加一个头(至少是一个用户代理:))。你知道吗
相关问题 更多 >
编程相关推荐