无法刮取span标记python

2024-10-03 09:19:51 发布

男 | 程序猿一只，喜欢编程写python代码。

因此，我正在尝试删除这个urlhttps://news.detik.com/berita/d-5259113/anies-usai-diklarifikasi-polisi-penjelasan-saya-jadi-laporan-23-halaman。我要刮取的是span标记上的字符串。

我想从那个url中删除“293”字符串。但结果是AttributeError: 'NoneType' object has no attribute 'text'错误。甚至我在div标记上面的span标记上使用find（）并打印它，结果是None。这是我的代码：

sol = ('https://news.detik.com/berita/d-5259113/anies-usai-diklarifikasi-polisi-penjelasan-saya-jadi-laporan-23-halaman')

chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-dev-shm-usage')
  
driver = webdriver.Chrome(executable_path='/usr/bin/chromedriver',chrome_options=chrome_options)
driver.get(sol)
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);var lenOfPage=document.body.scrollHeight;return lenOfPage;")

html2 = driver.page_source
soupa = BeautifulSoup(html2)

ala = soupa.find('span', {'class','comment__cmt_count_komen___12bbw'}).text
print(ala)

任何帮助都将不胜感激

Tags：标记 com add driver chrome argument options news

1条回答

网友

1楼 · 发布于 2024-10-03 09:19:51

请尝试等待，直到设置了注释编号：

from selenium.webdriver.support.ui import WebDriverWait

element = driver.find_element_by_css_selector('a.komentar > span')
WebDriverWait(driver, 10).until(lambda driver: element.text != '0 komentar')
print(element.text.rstrip(' komentar'))

无法刮取span标记python

相关问题更多 >

编程相关推荐

热门问题

热门文章

无法刮取span标记python

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >