网站总是用过时的眉毛标记它

<div class=noscript>We\'re sorry but AniChart requires Javascript. <br>Please enable Javascript or <a href=http://outdatedbrowser.com>upgrade to a modern web browser</a>. </div></noscript><div class="noscript modern-browser" style="display: none">Sorry, AniChart requires a modern browser.<br>Please <a href=http://outdatedbrowser.com>upgrade to a newer web browser</a>.</div>

import requests self.url = 'https://anichart.net/Winter-2019' headers = {'User-agent': 'Chrome/72.0.3626.109'} self.page = requests.get(self.url, headers=headers) print(self.page.content)

from selenium import webdriver url = 'https://anichart.net/Winter-2019' website = webdriver.Chrome() website.get(url) print(website.page_source) html_after_JS = website.execute_script("return document.body.innerHTML") print(html_after_JS)

1条回答

网友

1楼 · 发布于 2024-10-02 22:33:52

问题不在于浏览器检测。你知道吗

requests只是呈现JavaScript（您似乎已经知道了），现在大多数网站都使用前端JavaScript库来呈现内容。还有一些网站使用Javascript检测来防止机器人抓取网页。。。你知道吗

相反，您需要使用Selenium这样的工具，它将打开一个无头的“现代”浏览器，由您选择，您可以从那里刮下页面。但是您还没有展示该代码，所以您应该问一下这个问题？你知道吗

或者，更好的是，他们有一个API-https://github.com/AniList/ApiV2-GraphQL-Docs

The AniList & AniChart websites themselves run on the Api, so everything you can do on the sites, you can do via the Api.

相关问题更多 >

编程相关推荐

热门问题

热门文章