如何使用BeautifulSoup选择带有属性的标签,而不知道该属性的值是什么?

2024-05-20 10:26:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我现在正在从一个Wikipedia page 中抓取数据。有一个表包含地区、地点、武器成本等。。。。,非瑞士公民。你知道吗

读取源页面后,表位于第二个数字中,即另一个表位于其前面。你知道吗

使用代码从页中提取此表后:

source = requests.get("https://en.wikipedia.org/wiki/Subdivisions_of_Z%C3%BCrich").text
soup = BeautifulSoup(source,'lxml')
tables = soup.find_all("table")
secondTable = tables[1]

另一个td标签之间的唯一区别是邻域列中的属性title。你知道吗

Image showing the above condition

我只需要选择具有title属性的<td>标记,但是它们的值不同,我不知道如何选择它。你知道吗


Tags: 数据sourcetables属性titlepage页面wikipedia
1条回答
网友
1楼 · 发布于 2024-05-20 10:26:02

可以使用只与属性匹配的选择器,而不指定值:

tables.select("td[title]")

或者可以使用True作为属性的值,使用find_all()匹配任何值:

tables.find_all("td", title=True)

相关问题 更多 >