在动态变化的html中删除隐藏元素

from selenium import webdriver driver = webdriver.Chrome('/Users/Abramo/SeleniumDrivers/chromedriver') from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC driver.get('https://www.mitartlending.com/featuredartworks') driver.implicitly_wait(3) my_element = driver.find_element_by_xpath(f'/html/body/div[5]/div[2]/div/main/section/div/div/div/div[3]/div/div/div/div[1]/div/a/img') my_element.click() copy_from = driver.find_element_by_class_name('sqs-lightbox-meta overlay-description-visible') my_next_button = driver.find_element_by_class_name('sqs-lightbox-next')

2条回答

网友

1楼 · 编辑于 2024-09-29 20:15:16

您可以通过以下方式找到这些图像中的任何一个：

images = driver.find_elements_by_xpath('//img[contains(@class,'thumb-image loaded')]')

例如，点击第二张你可以使用的图片

images[1].click()

要将鼠标悬停在图元上，可以执行以下操作：

from selenium.webdriver.common.action_chains import ActionChains

hover = ActionChains(driver).move_to_element(images[1])
hover.perform()

现在，当文本出现时，您可以定位并获取它

text = driver.find_elements_by_xpath('(//img[contains(@class,'thumb-image loaded')])[2]/..//p').text

其他任何图像也可以这样做。
总的来说，代码如下所示：

from selenium.webdriver.common.action_chains import ActionChains

images = driver.find_elements_by_xpath('//img[contains(@class,"thumb-image loaded")]')
images[1].click()

time.sleep(2)
hover = ActionChains(driver).move_to_element(images[1])
hover.perform()

time.sleep(2)
text = driver.find_elements_by_xpath('(//img[contains(@class,"thumb-image loaded")])[2]/..//p')
for t in text:
    print(t.text)

我添加sleeps只是为了简单起见，而它更倾向于使用预期条件等待

网友

2楼 · 编辑于 2024-09-29 20:15:16

数据都在属性中。您只需要提取适当的。不需要硒的开销

import requests
from bs4 import BeautifulSoup as bs

r = requests.get('https://www.mitartlending.com/featuredartworks')
soup = bs(r.content, 'lxml')
results = {i['data-title']:' '.join(bs(i['data-description'], 'lxml').text.split('\n')) for i in soup.select('.margin-wrapper > a')}
print(results)

相关问题更多 >

编程相关推荐

热门问题

热门文章