如何使用“：：before”在selenium中获取隐藏的href标记

<div class="exp-product-wall clearfix"> ::before <div class="grid-item fullSize" data-pdpurl="https://www.nike.com/t/epic-react-flyknit-2-mens-running-shoe-459stf" data-column-index="0" data-item-index="1"> <div class="grid-item-box"> <div class="grid-item-content"> <div class="grid-item-image"> <div class="grid-item-image-wrapper sprite-sheet sprite-index-1"> <a href="https://www.nike.com/t/epic-react-flyknit-2-mens-running-shoe-459stf"> <img src="https://images.nike.com/is/image/DotCom/pwp_sheet2?$NIKE_PWPx3$&$img0=BQ8928_001&$img1=BQ8928_003&$img2=BQ8928_005">

1条回答

网友

1楼 · 发布于 2024-10-04 11:24:48

你可以很容易地得到请求的网址。我的目标是data pdpurl属性。在selenium循环中，您可能需要添加一些对位置请求的处理。在循环过程中需要短暂的等待，以防止产品不可用的错误声明。在

import requests
from bs4 import BeautifulSoup as bs
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time

d = webdriver.Chrome()
results = []

r = requests.get('https://store.nike.com/us/en_us/pw/mens-running-shoes/7puZ8yzZoi3')
soup = bs(r.content, 'lxml')
products = []
listings = soup.select('.grid-item')

for listing in listings:
    url = listing['data-pdpurl']
    title = listing.select_one('.product-display-name').text
    row = {'title' :title ,
           'url' : url}
    products.append(row)

for product in products:
    url = product['url']
    d.get(url)
    try:
        d.get(url)
        desc = WebDriverWait(d,10).until(EC.presence_of_element_located((By.CSS_SELECTOR, ".description-preview")))
        results.append({'product_name': product['title'],
                        'descr' : desc.text})
    except Exception as e:
        print(e, url)
    finally:
        time.sleep(1)

d.quit()
print(results)

相关问题更多 >

编程相关推荐

热门问题

热门文章