问题:从似乎发生变化的网站中删除数据

2024-09-30 08:25:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我正试图从https://gbr.milesplit.com/athletes/pro/5424599/stats上的公关学院表中获取数据 代码看起来像

prTable = wait.until(EC.presence_of_element_located((By.XPATH, '/html/body/div[5]/div/aside/div[4]/table')))

有时我得到的回答是正确的,它是一个包含个人记录的字符串。其他时候,它只是从网页上获取随机信息,偶尔也找不到元素。我很困惑为什么它有时有效,但不是一直有效。有没有比xpath更好的方法,或者我使用了错误的标记


Tags: 代码httpsdivcomstatspro学院until
1条回答
网友
1楼 · 发布于 2024-09-30 08:25:37

使用以下示例,您可以使用beautifulsoup解析页面:

from bs4 import BeautifulSoup
import requests


url = 'https://gbr.milesplit.com/athletes/pro/5424599/stats'
soup = BeautifulSoup(requests.get(url).content, 'html.parser')

for event, time in zip(soup.select('td.event'),
                       soup.select('td.time')):
    print(event.text, time.text)

印刷品:

800 Meter Run 1:48.05
1500 Meter Run 3:35.01
800 Meter Run 1:48.87
One Mile Run 3:57.02
8000 Meter Run 24:01.50
10,000 Meter Run 30:43.50
800 Meter Run 1:52.25
One Mile Run 4:05.32
1500 Meter Run 3:43.46
800 Meter Run 1:48.05
1500 Meter Run 3:35.01
800 Meter Run 1:48.87
One Mile Run 3:57.02
8000 Meter Run 24:01.50
10,000 Meter Run 30:43.50
800 Meter Run 1:52.25
One Mile Run 4:05.32
1500 Meter Run 3:43.46

相关问题 更多 >

    热门问题