我在寻找一种获得特定标签的方法。。从一个很大的xml文档
内置python dom模块
例如:
<AssetType longname="characters" shortname="chr" shortnames="chrs">
<type>
pub
</type>
<type>
geo
</type>
<type>
rig
</type>
</AssetType>
<AssetType longname="camera" shortname="cam" shortnames="cams">
<type>
cam1
</type>
<type>
cam2
</type>
<type>
cam4
</type>
</AssetType>
我要检索AssetType节点的子节点的值,这些子节点具有属性(longname=“characters”)
得到'pub','geo','rig'
的结果
请记住,我有1000多个<;AssetType>;节点
提前付款
如果您不介意将整个文档加载到内存中:
您可能需要删除标记开头的空格才能使此操作生效。
假设您的文档名为
assets.xml
,并且具有以下结构:然后您可以执行以下操作:
您可以使用pulldom API来处理对大文件的解析,而不必一次将其全部加载到内存中。与使用SAX相比,这提供了一个更方便的接口,而且性能损失很小。
它基本上允许您流式处理xml文件,直到找到您感兴趣的位为止,然后在这之后开始使用regular DOM operations。
相关问题 更多 >
编程相关推荐