如何刮取<span title>？

<div class="heading4 color-text-primary singleLineTitle tapItem-gutter"> <h2 class="jobTitle jobTitle-color-purple jobTitle-newJob"> <div class="new topLeft holisticNewBlue desktop"> <span class = "label">new</span> </div> <span title="Freight Stocker"> Freight Stocker </span> </h2> </div>

import requests from bs4 import BeautifulSoup def extract(page): headers = {''} url = f'https://www.indeed.com/jobs?l=Bakersfield%2C%20CA&start={page}&vjk=42cee666fbd2fae9' r = requests.get(url, headers) soup = BeautifulSoup(r.content, 'html.parser') return soup def transform(soup): divs = soup.find_all('div', class_ = 'heading4 color-text-primary singleLineTitle tapItem-gutter') for item in divs: res = item.find('span').text print(res) return c=extract(0) transform(c)

1条回答

网友

1楼 · 发布于 2024-06-26 00:15:07

您可以使用CSS选择器.resultContent span[title]，它将选择类resultContent中具有title属性的所有<span>

要使用CSS选择器，请使用^{}方法而不是.find()：

soup = BeautifulSoup(requests.get(url).content, 'html.parser')

for tag in soup.select(".resultContent span[title]"):
    print(tag.text)

相关问题更多 >

编程相关推荐

热门问题

热门文章