无法找到并处理从HTML中提取的文本

from bs4 import BeautifulSoup import requests import re url = 'http://www.autotaskstatus.net/' r = requests.get(url) estado = r.status_code r = r.content soup = BeautifulSoup(r, "html.parser") data = soup.find_all('span', attrs={'class':'name'})[1] pais = 'Spanish' data.get_text() print(data.text)

<div data-component-id="fp5s6cp13l47" class="component-inner-container status-green " data-component-status="operational" data-js-hook=""> Concord   ? Operational 

1条回答

网友

1楼 · 发布于 2024-10-01 22:44:25

您可以使用以下方法获取西班牙服务器状态：

from bs4 import BeautifulSoup
import requests

URL = 'http://www.autotaskstatus.net/'
with requests.session() as s:
    s.headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:50.0) Gecko/20100101 Firefox/50.0'}
    r = s.get(URL)
    soup = BeautifulSoup(r.content, "html.parser")
    data = soup.find_all('div', attrs={'class':'component-inner-container'})
    pais = 'Spanish'
    print([d.find('span', {'class': 'name'}).text.strip() + ' - ' + d.find('span', {'class': 'component-status'}).text.strip() for d in data if pais in d.text])

相关问题更多 >

编程相关推荐

热门问题

热门文章