无法查看websi的页面源

2024-05-08 20:53:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我编写了一个简单的python脚本来查看网站。The网站是https://kissanime.to。我正在使用下面的一小段代码。在

    import urllib2
    url = 'https://kissanime.to'
    link = urllib2.urlopen(url)
    print link

但是,上述进程不起作用,并显示以下错误消息

HTTP Error 403 : Forbidden

我试着在社区里找到解决上述问题的办法,并想出了这个办法:

^{pr2}$

但是上面的方法也失败了,现在我得到了错误:-在

HTTP Error 503 : Service Temporarily Unavailable

有什么解决这个问题的方法吗?我对python的这种web爬行特性很陌生。 请帮忙。在


Tags: theto方法代码https脚本httpurl
1条回答
网友
1楼 · 发布于 2024-05-08 20:53:32

检查了这个网站,它会让你等5秒钟,然后再显示它的主要内容。在

我使用了requests模块,得到了这个初始页面,上面写着“Wait 5 seconds”:

import requests

r = requests.get("https://kissanime.to/")

# Throws an Insecure Platform warning on certain versions of python

print r.content

然而,根据你到底想刮的是什么,你可以先从引擎盖下开始了解网站是如何建立的,并设计一个策略来刮取你想要的内容。在

我必须说,看了一下网站上的网络电话,它是相当顽固的,因为每个电话都有大量的参数和cookies嵌入其中。在

你到底想从这个网站上搜到什么?在

同时,服务器在显示初始页面时返回503,该页面显示“Wait 5 seconds…”

相关问题 更多 >