网站在浏览器中打开，但在Python中打开时返回403 - 问答 - Python中文网

网站在浏览器中打开，但在Python中打开时返回403

2024-10-02 20:38:07 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

有一个网站在浏览器中愉快地打开，在Python中打开时返回403 HTTP错误，如下所示：

from bs4 import BeautifulSoup
import urllib2

link = 'http://niezalezna.pl/'

r = urllib2.urlopen(link).read()
soup = BeautifulSoup(r, 'lxml')

print soup.prettify()

这个网站是一个很受欢迎的新闻服务。那么，当使用上面这样的代码打开时，是否可以使URL返回htp403错误？谢谢

Tags： from import http 网站错误 link 浏览器 urllib2

1条回答

网友

1楼 · 发布于 2024-10-02 20:38:07

感谢上面的评论找到了答案。代码在下面，完整的答案可以在这里找到：Changing user agent on urllib2.urlopen

from bs4 import BeautifulSoup
import urllib2

link = 'http://niezalezna.pl/'

opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
response = opener.open(link)

soup = BeautifulSoup(response, 'lxml')

print soup.prettify()

相关问题更多 >

编程相关推荐

热门问题

热门文章