擅长:python、mysql、java
<p>beautifulGroup标记对象有一个<code>name</code>属性,您可以检查它。例如,下面是一个函数,它通过向postwalk中的每个节点添加字符串“Done with this”+适当的标记名来转换树:</p>
<pre><code>def walk(soup):
if hasattr(soup, "name"):
for child in soup.children:
walk(child)
soup.append("Done with this " + soup.name)
</code></pre>
<p>注意。表示文本内容的<code>NavigableString</code>对象和表示注释的<code>Comment</code>对象没有诸如<code>name</code>或{<cd5>}之类的属性,因此,如果您像上面一样遍历整个树,则需要检查是否确实手头有一个标记(我正在使用上面的<code>hasattr</code>调用;我想您可以检查类型是<code>bs4.element.Tag</code>)。在</p>