import lxml.html as LH
import lxml.etree as ET
content='<root><div id="pgbrk" ......>....Page Break....</div></root>'
doc=LH.fromstring(content)
# print(LH.tostring(doc))
for div in doc.xpath('//div[@id="pgbrk"]'):
parent=div.getparent()
parent.replace(div,ET.Comment("page break"))
print(LH.tostring(doc))
您可以使用普通DOMhttp://docs.python.org/library/xml.dom.minidom.html
1)解析源代码
2)找到要删除的节点
^{pr2}$3)找到目标节点后,用新的注释节点替换它们
文件:http://docs.python.org/library/xml.dom.html
只要
div
有父标记,就可以执行以下操作:收益率
^{pr2}$相关问题 更多 >
编程相关推荐