使用selenium使用jscript\u doPostBack链接显示“下一个”搜索结果

import requests, re from bs4 import BeautifulSoup from selenium import webdriver browser = webdriver.Chrome('../chromedriver') url ='http://jobquest.detma.org/JobQuest/Training.aspx' browser.get(url)

1条回答

网友
1楼 · 发布于 2024-10-02 14:27:53

可以使用attribute = value selector以href为目标。在本例中，我使用末尾的子字符串via contains（*）操作符。你知道吗
WebDriverWait(browser, 10).until(EC.element_to_be_clickable((By.CSS_SELECTOR, '[href*=ctl08]'))).click()
我添加了一个等待点击的条件作为预防措施。你可以把它去掉。你知道吗
额外进口
from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By
无等待条件：
browser.find_element_by_css_selector('[href*=ctl08]'),click()
另一种方式：
现在，您可以先将页面结果计数设置为100（最大值），然后通过下拉列表循环搜索结果页面以加载每个新页面（这样就不需要计算有多少页面）
import requests, re from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By browser = webdriver.Chrome() url ='http://jobquest.detma.org/JobQuest/Training.aspx' browser.get(url) submit_button = browser.find_element_by_id('ctl00_ctl00_bodyMainBase_bodyMain_btnSubmit') submit_button.click() WebDriverWait(browser, 10).until(EC.element_to_be_clickable((By.CSS_SELECTOR, '[value="100"]'))).click() html = browser.page_source soup = BeautifulSoup(html, "html.parser") rows = soup.find_all("tr",{"class":"gvRow"}) id_list=[] for row in rows: temp = str(row.find("a"))[33:40] id_list.append(temp) elems = browser.find_elements_by_css_selector('#ctl00_ctl00_bodyMainBase_bodyMain_egvResults select option') i = 1 while i < len(elems) / 2: browser.find_element_by_css_selector('#ctl00_ctl00_bodyMainBase_bodyMain_egvResults select option[value="' + str(i) + '"]').click() #do stuff with new page i+=1
您可以决定如何从每个页面提取行信息。这是给你一个简单的框架来循环所有的页面。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章