用Python获取部分XML文档

2024-05-19 05:21:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我有匹配DTD的XML文件

<!ELEMENT root (node, notinteresting>
<!ELEMENT node (node*)>
<!ELEMENT notinteresting (#PCDATA)>

我想检索这样一个文件的最上面的节点(在XPath:/root/node)和它下面的所有内容,忽略notinteresting位。如何用Python的几行代码做到这一点呢?速度/内存消耗不是问题。我想要一些我能print的东西。在


Tags: 文件内存代码node内容节点rootxml
2条回答

看看2个模块

1)minidom

2)ElementTree

两者都能让你随心所欲,尽管方式略有不同。在

您可以使用elementtree API,这取决于您将使用的版本,导入可能略有不同。您需要version>;=python 2.7

from xml.etree.ElementTree import ElementTree
tree = ElementTree()
tree.parse("yourdoc.xml")
roottree = tree.getroot() 

这样你就有可能做类似的事情。在

^{pr2}$

请注意,如果您的输入只有一个字符串,那么可以使用fromstring()

更新:如果“root”是xml文件的根元素,也可以使用

^{3}$

相关问题 更多 >

    热门问题