提取没有span class属性和相同div class属性的html

import requests from bs4 import BeautifulSoup import pandas as pd import re headers = { "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:70.0) Gecko/20190101 Firefox/70.0" } url = "https://www.truecar.com/prices-new/chevrolet/malibu-pricing/?zipcode=44070" print(url) page = requests.get( url, headers=headers) soup = BeautifulSoup(page.content, 'html.parser') test = soup.find('span', {'class': 'pricing-block-amount-strikethrough'}) print(test.get_text())

1条回答

网友

1楼 · 发布于 2024-10-02 02:36:04

如果您浏览页面，它需要时间才能获得您要查找的第二个值。在“请求”模块中，它可以快速获取内容，而不必等待内容完全加载。这就是添加含bs4的硒元素的地方。添加等待站点加载，然后获取页面内容

你可以从link下载geckodriver

import time
from bs4 import BeautifulSoup
from selenium import webdriver

url = "https://www.truecar.com/prices-new/chevrolet/malibu-pricing/?zipcode=44070"

driver = webdriver.Firefox(executable_path=r'geckodriver.exe')
driver.get(url)
time.sleep(7)
soup = BeautifulSoup(driver.page_source, 'html')
div = soup.find_all('div', {'class': 'label-block-text'})
for x in div:
    span = x.find('span')
    print(span.get_text())

相关问题更多 >

编程相关推荐

热门问题

热门文章