HTTPError 999:“禁止黑客攻击”

2024-09-19 23:30:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我有个问题: 我正在尝试用Python创建一个脚本来下载一个web站点并查找一些信息。在

代码如下:

import urllib.request

url_archive_of_nethys = "http://www.aonprd.com/Default.aspx"


def getMainPage():
    fp = urllib.request.urlopen(url_archive_of_nethys)
    mybytes = fp.read()
    mystr = mybytes.decode("utf8")
    fp.close()
    print(mystr)



def main():
    getMainPage()


if __name__ == "__main__":
    main()

但当我开始的时候我得到:

^{pr2}$

我还尝试使用curl命令:

curl http://www.aonprd.com/Default.aspx

我正确地下载了这个页面

我正在使用visualstudio和python3.6进行开发

如有任何建议,我们将不胜感激 谢谢你


Tags: ofcomhttpdefaulturlmainrequestdef
1条回答
网友
1楼 · 发布于 2024-09-19 23:30:16

他们可能会检测到你的用户代理并过滤你。 尝试改变它:

req = urllib.request.Request(
        url, 
        data=None, 
        headers={'User-Agent': ("Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) "
                                "AppleWebKit/537.36 (KHTML, like Gecko) " 
                                "Chrome/35.0.1916.47 Safari/537.36")})
fp = urllib.request.urlopen(req)

相关问题 更多 >