美女们没上好课

2024-10-05 13:16:58 发布

您现在位置:Python中文网/ 问答频道 /正文

https://etherscan.io/address/0xCcE984c41630878b91E20c416dA3F308855E87E2

我想刮取标记标签旁边的lisbox href

我需要从

class="link-hover d-flex justify-content-between align-items-center"

所以我的代码是:

import requests
from bs4 import BeautifulSoup

page = requests.get('https://etherscan.io/address/0xCcE984c41630878b91E20c416dA3F308855E87E2').text
html = BeautifulSoup(page, 'html.parser')

href = html.find(class_ = 'link-hover d-flex justify-content-between align-items-center')['href']

然而,结果是什么都没有。有人能帮我吗? 我真的需要一些帮助


Tags: httpsioaddresshtmllinkitemscontentbetween
1条回答
网友
1楼 · 发布于 2024-10-05 13:16:58

我认为对于请求库,您不能这样做,因为Cloudflare检测到自动化

>>> page = requests.get('https://etherscan.io/address/0xCcE984c41630878b91E20c416dA3F308855E87E2')
>>> page.status_code
403

HTTP 403禁止的客户端错误状态响应代码表示服务器理解该请求,但拒绝对其进行授权。 请尝试selenium库,而不是bs4
Page title

>>> soup = BeautifulSoup(page.content, 'html.parser')
>>> soup.title
>>> <title>Attention Required! | Cloudflare</title>

相关问题 更多 >

    热门问题