刮页时内部循环重复次数太多。每页约45次

count = 1 while True: try: soup = BeautifulSoup(driver.page_source, 'lxml') leadFields = soup.find_all('div', class_='leadFields') snippets = soup.find_all('div', class_="snippet ensnippet") for l, s in zip(leadFields, snippets): print (l.get_text(strip=True) + s.get_text(strip=True)) print(count) count+=1 nextBtn = WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.CSS_SELECTOR, 'a.nextItem'))) action = webdriver.common.action_chains.ActionChains(driver) action.move_to_element(nextBtn) action.click(nextBtn).perform() except TimeoutException: break

1条回答

网友

1楼 · 发布于 2024-10-04 11:24:26

添加

wait = WebDriverWait(driver, 30)
wait.until(lambda driver: driver.execute_script("return jQuery.active == 0"))

下一次点击后。你知道吗

另外，如果将来有人看到这一点，不要使用TimeoutException来打破一个临时的循环。你知道吗

在评论中大声向pcalkins寻求帮助。你知道吗

编程相关推荐

java Android/OkHttp获取源代码
java如何清理jComboBox中的空白
java Dagger 2和改型2更改基本URL
java while（1）使用continue和break语句循环
java如何在JGroup中禁用FIFO和重新传输协议？
java Log4j 2 JSON模式布局+记录JSON负载
google应用程序引擎Firebase Java管理SDK错误
如果我已经编写了显示目录的代码，我将如何制作它，以便java能够说明这个结果是一个文件，还是另一个目录/文件夹？
java Twilio:Twilio。装置connect（）未命中语音请求URL
在Java中加载带有JRI的R库时写入内核转储失败

相关问题更多 >

编程相关推荐

热门问题

热门文章