获取包含字符串的参数属性

网友

1楼 · 编辑于 2024-06-01 09:51:46

你什么也得不到，因为没有一个固定的标题只是命名为Sports，它不像通配符那样工作。如果要获取title的属性值，可以在使用find_all获得的标记对象上使用get(attr_name)。你知道吗

from bs4 import BeautifulSoup

html = '''<span title="Sports Football">Football</span>
<span title="Sports Badminton">Tennis</span>
<span title="Sports Ski Jump">Ski Jump</span>'''

soup = BeautifulSoup(html,"lxml")

title = [s.get('title') for s in soup.find_all('span')]
title
>> ['Sports Football', 'Sports Badminton', 'Sports Ski Jump']

除此之外，如果您只需要该元素的文本，只需对来自find_all的标记对象使用.text方法即可。你知道吗

sports = [s.text for s in soup.find_all('span')]
sports
>>['Football', 'Tennis', 'Ski Jump']

网友

2楼 · 编辑于 2024-06-01 09:51:46

如果title属性的第一部分是"Sports"，则可以使用re.compile和BeautifulSoup来查找所有span标记：

content = """
 <span title="Sports Football">Football</span>
 <span title="Sports Badminton">Tennis</span>
 <span title="Sports Ski Jump">Ski Jump</span>
"""

import re
from bs4 import BeautifulSoup as soup
d = soup(content, 'html.parser')
results = [i.text for i in d.find_all('span', {'title':re.compile('^Sports\s')})]

输出：

['Football', 'Tennis', 'Ski Jump']

网友

3楼 · 编辑于 2024-06-01 09:51:46

也许你所举的例子是从你的头顶编造出来的，但是你的跨距的内容与你想要的完全匹配——所以在这个例子中，你可以通过以下方法来解决： sports = soup.find_all('span', {'title': 'Sports'}).contents 这将为您提供所需内容的字符串版本。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

获取包含字符串的参数属性

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >