在BeautifulSoup中，如何搜索包含文本但也有某个类的祖先的元素？

<div class="article class7"> <p> <div class="abc"> <span class="outerSpan"> <span>8000 points</span> </span> </div> </p> </div>

3条回答

网友

1楼 · 编辑于 2024-09-30 23:36:36

from bs4 import BeautifulSoup
import re

data = """
<div class="article class2">
    <span class="outerSpan">
        <span class="innerSpan">2000 points</span>
    </span>
</div>
"""

soup = BeautifulSoup(data, 'html.parser')
for item in soup.findAll(text=re.compile('points$')):
    print(item)

输出：

2000 points

from bs4 import BeautifulSoup


data = """
<div class="article class2">
    <span class="outerSpan">
        <span class="innerSpan">2000 points</span>
    </span>
</div>
"""

soup = BeautifulSoup(data, 'html.parser')
for item in soup.findAll('span', {'class': 'innerSpan'}):
    print(item.text)

输出：

2000 points

网友

2楼 · 编辑于 2024-09-30 23:36:36

span = soup.find_all('span')
if 'points' in span[1].text:
    div = span[1].parent.parent
    print(div)

span变量包含所有span元素，我们将遍历回HTML标记的父级。考虑到这总是HTML的格式。你知道吗

网友

3楼 · 编辑于 2024-09-30 23:36:36

您可以使用css选择器并检查您正在处理的字符串。你知道吗

html='''<div class="article class2">
    <span class="outerSpan">
        <span class="innerSpan">2000 points</span>
    </span>
</div>
'''

soup=BeautifulSoup(html,'html.parser')
for item in soup.select('.article .innerSpan'):
   if 'points' in item.text:
       print(item.text)

或者你可以用这个。你知道吗

soup=BeautifulSoup(html,'html.parser')
for item in soup.select('.article:contains(points)'):
   print(item.text.strip())

相关问题更多 >

编程相关推荐

热门问题

热门文章

在BeautifulSoup中，如何搜索包含文本但也有某个类的祖先的元素？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >