如何使用BeautifulSoup在包含<p>元素的表中找到第一个<td>？

1条回答

网友

1楼 · 发布于 2024-10-03 23:21:37

您可以使用生成器：

first_td = next(td for td in soup.find_all('td') if td.p)
#               ^           generator                  ^

find_all将生成所有<td>标记。然后我们按td.p过滤标签。这将返回p标记（假设有一个）。否则它将返回None。由于None的真实性是False，而对于tag对象它是True，因此生成器将用一个<p>标记来枚举所有的<td>标记。在

我们调用next(..)来获得这些元素中的第一个。如果不存在这样的元素，它将引发StopIteration异常。在

如果您想要所有这些标记，可以使用列表理解：

^{pr2}$