无法查看websi的页面源 - 问答 - Python中文网

无法查看websi的页面源

2024-05-08 20:53:32 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我编写了一个简单的python脚本来查看网站。The网站是https://kissanime.to。我正在使用下面的一小段代码。在

    import urllib2
    url = 'https://kissanime.to'
    link = urllib2.urlopen(url)
    print link

但是，上述进程不起作用，并显示以下错误消息

HTTP Error 403 : Forbidden

我试着在社区里找到解决上述问题的办法，并想出了这个办法：

^{pr2}$

但是上面的方法也失败了，现在我得到了错误：-在

HTTP Error 503 : Service Temporarily Unavailable

有什么解决这个问题的方法吗？我对python的这种web爬行特性很陌生。请帮忙。在

Tags： the to 方法代码 https 脚本 http url

1条回答

网友

1楼 · 发布于 2024-05-08 20:53:32

检查了这个网站，它会让你等5秒钟，然后再显示它的主要内容。在

我使用了requests模块，得到了这个初始页面，上面写着“Wait 5 seconds”：

import requests

r = requests.get("https://kissanime.to/")

# Throws an Insecure Platform warning on certain versions of python

print r.content

然而，根据你到底想刮的是什么，你可以先从引擎盖下开始了解网站是如何建立的，并设计一个策略来刮取你想要的内容。在

我必须说，看了一下网站上的网络电话，它是相当顽固的，因为每个电话都有大量的参数和cookies嵌入其中。在

你到底想从这个网站上搜到什么？在

同时，服务器在显示初始页面时返回503，该页面显示“Wait 5 seconds…”

相关问题更多 >

编程相关推荐

热门问题

热门文章