如何使用Beautiful Soup 4查找属性

<tbody> <tr class data-row="0"> <td align="right"></td> </tr> <tr class data-row="1"> <td align="right"></td> </tr> <tr class="thead over_theader" data-row="2"> <td align="right"></td> </tr> <tr class="thead" data-row="3"> <td align="right"></td> </tr> <tr class data-row="4"> <td align="right"></td> </tr> <tr class data-row="5"> <td align="right"></td> </tr> </tbody>

2条回答

网友

1楼 · 编辑于 2024-09-29 21:47:47

默认情况下，find_all将递归搜索。因此，td标记是有效的匹配项。在

Docs：

If you call mytag.find_all(), Beautiful Soup will examine all the descendants of mytag: its children, its children’s children, and so on. If you only want Beautiful Soup to consider direct children, you can pass in recursive=False

所以你可以写，例如：

tableBody = soup.findAll('tbody')
rows = tableBody[0].find_all(attrs={"class":""}, recursive=False)

print(len(rows))
for r in rows:
    print(' -')
    print(r)

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-09-29 21:47:47

当我指定tr标记名时，您的方法实际上对我有效：

>>> from bs4 import BeautifulSoup
>>> data = """
... <tbody>
...     <tr class data-row="0">
...         <td align="right"></td>
...     </tr>
...     <tr class data-row="1">
...         <td align="right"></td>
...     </tr>
...     <tr class="thead over_theader" data-row="2">
...         <td align="right"></td>
...     </tr>
...     <tr class="thead" data-row="3">
...         <td align="right"></td>
...     </tr>
...     <tr class data-row="4">
...         <td align="right"></td>
...     </tr>
...     <tr class data-row="5">
...         <td align="right"></td>
...     </tr>
... </tbody>
... """
>>> soup = BeautifulSoup(data, "html.parser")
>>> len(soup.find_all("tr", class_=""))
4

{{cd2}也可以使用{cd2}：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章