如何提取div标记中的强元素

2024-10-01 11:34:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我是新来的。我使用Python来获取数据。 有人能帮我从以下位置提取数据:

<div class="dept"><strong>LENGTH:</strong> 15 credits</div>

我的输出应该是长度:15 credits

这是我的代码:

^{pr2}$

输出:

DELIVERY:  Campus
LENGTH:  2 years
OFFERED BY:  Olin Business School

但我只想要长度。在

网址:http://www.mastersindatascience.org/specialties/business-analytics/


Tags: 数据代码divbylengthclassstrongcredits
2条回答

您应该改进一下代码,以便通过文本找到strong元素

soup.find("strong", text="LENGTH:").next_sibling

或者,对于多个长度:

^{pr2}$

演示:

>>> import requests
>>> from bs4 import BeautifulSoup
>>>
>>> url = "http://www.mastersindatascience.org/specialties/business-analytics/"
>>> response = requests.get(url)
>>> soup = BeautifulSoup(response.content, "html.parser")
>>> for length in soup.find_all("strong", text="LENGTH:"):
...     print(length.next_sibling.strip())
... 
33 credit hours
15 months
48 Credits
...
12 months
1 year

如果有人还在找这个,下面是一个例子: age = soup.find('span', class_ = 'item birthday').find('strong').get_text()

相关问题 更多 >