Python和beautifulsoup Scrape Tex

import requests from bs4 import BeautifulSoup url = 'https://www.brightscope.com/401k-rating/240370/Abengoa-Bioenergy-Company-Llc/244317/Abengoa-Bioenergy-Us-401K-Savings-Plan/' thepage = requests.get(url) urlsoup = BeautifulSoup(thepage.text, "html.parser") plandata = urlsoup.find(class_="plans-section").text print(plandata)

2条回答

网友

1楼 · 编辑于 2024-10-03 04:31:24

你到底想从书页里找出什么？如果您希望按类获取div，这应该会有所帮助。在

urlsoup.findAll("div", { "class" :"rating-number"})

网友

2楼 · 编辑于 2024-10-03 04:31:24

import requests
from bs4 import BeautifulSoup


url = 'https://www.brightscope.com/401k-rating/141759/Aj-Kirkwood-Associates-Inc/143902/Aj-Kirkwood-Associates-Inc-401K-Profit-Sharing-Plan/'
thepage = requests.get(url)
urlsoup = BeautifulSoup(thepage.text, "html.parser")

rate = urlsoup.find(class_='rating-number').text
name = urlsoup.find(class_="name").text
print(rate, name)

输出：

^{pr2}$

使用re筛选器匹配包含特定文本的所有类：

If you pass in a regular expression object, Beautiful Soup will filter against that regular expression using its search() method.

在您的情况下：

import re
soup.find_all(class_=re.compile(r'data-text.+'))

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python和beautifulsoup Scrape Tex

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >