Beautifulsoup：获取每个单词的类名

for p in p_tags: my_tag_list = [] spans = p.findAll("span", recursive=False) for s in spans: text = s.text.split() for t in text: my_tag = [] my_tag.append(t) my_tag.append(s["class"][0])

1条回答

网友

1楼 · 发布于 2024-05-13 12:51:03

您可以通过find_all(text=True)遍历文本节点，进入树并获得^{}的class属性：

from bs4 import BeautifulSoup

data = """
<p>
<span class="A">I am </span>
<span class="B"><span class="C"> not </span> doing a great job </span>
</p>"""

soup = BeautifulSoup(data, "html.parser")

result = []
for text in soup.p.find_all(text=True):
    parent = text.parent
    parent_class = parent["class"][0] if "class" in parent.attrs else ""
    for word in text.split():
        result.append([word, parent_class])

print(result)

印刷品：

^{pr2}$

编程相关推荐

java查找事件分派线程冲突
java画布。DrawBitmap（）不会在安卓上绘制任何内容！！：(
ruby+appium或java+appium用于移动本机应用程序自动化
java Jersey REST字符编码
java使用json将字符串转换为Arraylist
java如何在Groovy中检查字符串是否与模式匹配
java如何在抽象arraylist中添加抽象arraylist
Java servlets，JSP更改内容od DIV
java在J2ME中通过http发送和接收数据，并处理菜单和屏幕
Jar文件与JAVA类路径的结合

相关问题更多 >

编程相关推荐

热门问题

热门文章

Beautifulsoup：获取每个单词的类名

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >