Web抓取文本返回0

2024-09-27 22:35:37 发布

您现在位置:Python中文网/ 问答频道 /正文

每当我尝试从网站上抓取一个数字并打印时,它总是返回0,即使我延迟它以让窗口先加载。 这是我的密码

from selenium import webdriver
import time
url = 'https://hytrack.me/'
browser = webdriver.Chrome(r'C:\Users\kinet\OneDrive\Documents\webscraper\chromedriver.exe')
browser.get(url)
text = browser.find_element_by_xpath('//*[@id="stat_totalPlayers"]').text
time.sleep(10)
print(text)

我所需要做的就是打印一些从网站上获取的文本。 我是做错了什么,还是完全错过了什么


Tags: textfromhttpsimportbrowserurl密码time
1条回答
网友
1楼 · 发布于 2024-09-27 22:35:37

您应该在获取元素之前设置延迟

from selenium import webdriver
import time
url = 'https://hytrack.me/'
browser = webdriver.Chrome(r'C:\Users\kinet\OneDrive\Documents\webscraper\chromedriver.exe')
browser.get(url)
time.sleep(10)

text = browser.find_element_by_xpath('//*[@id="stat_totalPlayers"]').text
print(text)

但最好使用显式等待,如下所示:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
url = 'https://hytrack.me/'
browser = webdriver.Chrome(r'C:\Users\kinet\OneDrive\Documents\webscraper\chromedriver.exe')
wait = WebDriverWait(driver, 20)
browser.get(url)
text = wait.until(EC.visibility_of_element_located((By.XPATH, '//*[@id="stat_totalPlayers"]'))).text
print(text)

相关问题 更多 >

    热门问题