擅长:python、mysql、java
<p>要从此站点获取状态<code>200</code>,请指定<code>User-Agent</code>HTTP头:</p>
<pre><code>import requests
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:81.0) Gecko/20100101 Firefox/81.0'}
result1 = requests.get("https://www.grainger.com/", headers=headers)
print('result1 is '+ str(result1.status_code))
</code></pre>
<p>印刷品:</p>
<pre><code>result1 is 200
</code></pre>
<p>这样做之所以有效,是因为有些网站会忽略那些似乎不是从web浏览器发出的请求。默认情况下,<a href="https://github.com/psf/requests/blob/master/requests/utils.py#L805" rel="nofollow noreferrer">requests</a>使用<code>User-Agent</code>{<cd4>},因此网站可以告诉您没有从web浏览器请求网站。您的请求挂起并最终超时的原因可能是因为他们的服务器忽略了您的请求</p>