如何使用python selenium在页面上打开不同的链接以进行抓取？

driver = webdriver.Chrome(ChromeDriverManager().install()) driver.get("https://www.homeworkmarket.com/fields/business-finance") time.sleep(2) doc = driver.find_elements_by_xpath('//*[@id="wrapper"]/div[2]/div[1]/div[1]/div[3]/div[1]/ul/li[1]/a')[0] doc.click() time.sleep(10) page = driver.page_source soup = BeautifulSoup(page, 'html.parser')

question_links = soup.find_all(class_='css-e5w42e') final_links = [] for link in question_links: if 'href' in link.attrs: link = 'https://www.homeworkmarket.com' + str(link.attrs['href']) print(link) final_links.append(link)

2条回答

网友
1楼 · 编辑于 2024-10-03 19:23:08

这不会打开新页面，只会扩展现有页面上的某些区域。
页面源在可视化扩展之前就包含了这些数据，这就是为什么单击该按钮仍然通过执行
page = driver.page_source

网友
2楼 · 编辑于 2024-10-03 19:23:08

您无需单击“新建”，因为HTML DOM中已存在元素：
driver = webdriver.Chrome(ChromeDriverManager().install()) driver.maximize_window() driver.implicitly_wait(30) driver.get("https://www.homeworkmarket.com/fields/business-finance") for link in driver.find_elements(By.XPATH, "(*//a[text()='New']/ancestor::div[contains(@class,'css')])[3]/following-sibling::div/section/descendant::a[contains(@class,'css')]"): print(link.get_attribute('href'))
最初的80个链接来自流行标签，其余的应该来自新标签

相关问题更多 >

编程相关推荐

热门问题

热门文章