java在使用jsoup解析时摆脱html属性及其值
我试图以这样一种方式解析多个html文档,只得到丢弃其所有属性和值的标记。谁能帮帮我吗
例如:<img src="pic_trulli.jpg" alt="Italian Trulli">
更改为
<img>
类似地,我希望它适用于HTML文档中的所有标记
你可以在下面搜索框中键入要查询的问题!
我试图以这样一种方式解析多个html文档,只得到丢弃其所有属性和值的标记。谁能帮帮我吗
例如:<img src="pic_trulli.jpg" alt="Italian Trulli">
更改为
<img>
类似地,我希望它适用于HTML文档中的所有标记
# 1 楼答案
如果您的目标是接收清晰的文档结构,那么还需要删除文本和数据节点。考虑下面的片段。
输出:
# 2 楼答案
您可以遍历文档中的所有元素,然后遍历每个元素的属性,这应该允许您删除它们
演示:
输出:
# 3 楼答案
要删除单个元素的属性,可以使用以下方法:
要删除所有元素的属性,可以将其与
document.getAllElements()
结合使用:结果将是: