import xml.etree.ElementTree as et
doc = """<TD>
Textline1<BR/>
Textline2<BR/>
Textline3
</TD>
"""
e = et.fromstring(doc)
items = []
for x in e.getiterator():
if x.text is not None:
items.append(x.text.strip())
if x.tail is not None:
items.append(x.tail.strip())
doc2 = et.Element("lines")
for i in items:
l=et.SubElement(doc2, "line")
l.text = i
print(et.tostring(doc2))
我不认为标签是空的是你的问题。xml.etree可能不希望您将子元素和纯文本节点混合在一起。在
BeautifulSoup非常适合解析格式不好的XML或HTML:
您需要使用<;br>;元素的.tail属性。在
相关问题 更多 >
编程相关推荐