使用XML.etree.ElementTree捕获所有XML元素路径

TreatmentEpisodes TreatmentEpisodes/TreatmentEpisode TreatmentEpisodes/TreatmentEpisode/SourceRecordIdentifier TreatmentEpisodes/TreatmentEpisode/FederalTaxIdentifier TreatmentEpisodes/TreatmentEpisode/ClientSourceRecordIdentifier etc.

1条回答

网友
1楼 · 发布于 2024-10-01 13:45:59

开始于：
import xml.etree.ElementTree as et
解决问题的一个有趣方法是使用iterparse-An 迭代解析器包含在元素树中
它能够为每个分析的元素报告例如每个开始和结束事件。有关详细信息，请在Web上搜索iterparse的文档/示例
其想法是：
从一个空列表开始，作为路径
在开始事件时，将元素名称附加到路径并打印完整的 到目前为止收集的路径
在结束事件时，从路径中删除最后一个元素
您甚至可以将此代码包装到一个生成器函数中：
def pathGen(fn): path = [] it = et.iterparse(fn, events=('start', 'end')) for evt, el in it: if evt == 'start': path.append(el.tag) yield '/'.join(path) else: path.pop()
现在，当您运行时：
for pth in pathGen('Input.xml'): print(pth)
您将获得所有元素的完整路径的打印输出在源文件中，类似于：
TreatmentEpisodes TreatmentEpisodes/TreatmentEpisode TreatmentEpisodes/TreatmentEpisode/SourceRecordIdentifier TreatmentEpisodes/TreatmentEpisode/FederalTaxIdentifier TreatmentEpisodes/TreatmentEpisode/ClientSourceRecordIdentifier TreatmentEpisodes/TreatmentEpisode TreatmentEpisodes/TreatmentEpisode/SourceRecordIdentifier TreatmentEpisodes/TreatmentEpisode/FederalTaxIdentifier TreatmentEpisodes/TreatmentEpisode/ClientSourceRecordIdentifier ...

相关问题更多 >

编程相关推荐

热门问题

热门文章