无法刮取span标记python

2024-10-03 09:19:51 发布

您现在位置:Python中文网/ 问答频道 /正文

因此,我正在尝试删除这个urlhttps://news.detik.com/berita/d-5259113/anies-usai-diklarifikasi-polisi-penjelasan-saya-jadi-laporan-23-halaman。我要刮取的是span标记上的字符串。 enter image description here

我想从那个url中删除“293”字符串。但结果是AttributeError: 'NoneType' object has no attribute 'text'错误。甚至我在div标记上面的span标记上使用find()并打印它,结果是None。这是我的代码:

sol = ('https://news.detik.com/berita/d-5259113/anies-usai-diklarifikasi-polisi-penjelasan-saya-jadi-laporan-23-halaman')

chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-dev-shm-usage')
  
driver = webdriver.Chrome(executable_path='/usr/bin/chromedriver',chrome_options=chrome_options)
driver.get(sol)
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);var lenOfPage=document.body.scrollHeight;return lenOfPage;")

html2 = driver.page_source
soupa = BeautifulSoup(html2)

ala = soupa.find('span', {'class','comment__cmt_count_komen___12bbw'}).text
print(ala)

任何帮助都将不胜感激


Tags: 标记comadddriverchromeargumentoptionsnews
1条回答
网友
1楼 · 发布于 2024-10-03 09:19:51

请尝试等待,直到设置了注释编号:

from selenium.webdriver.support.ui import WebDriverWait

element = driver.find_element_by_css_selector('a.komentar > span')
WebDriverWait(driver, 10).until(lambda driver: element.text != '0 komentar')
print(element.text.rstrip(' komentar'))

相关问题 更多 >