使用ElementTree访问xml文件中的元素和标记时获取空列表

1条回答

网友

1楼 · 发布于 2024-09-27 04:18:44

代码失败的原因是XML使用默认名称空间（xmlns=”http://...“）

但是对findall的调用包含epoch而没有任何名称空间，因此它不是可能会找到任何东西

要处理名称空间的XML，您必须：

比如：

ns = {'ep': 'http://www.egi.com/epochs_mff'}
epoch_list = tree.findall('ep:epoch', ns)

结果是：

[<Element '{http://www.egi.com/epochs_mff}epoch' at 0x...>]

如果你不在乎的话，还可以获取你的endTime元素的内容 XML树中的任何中间元素，请运行：

tree.findtext('.//ep:endTime', namespaces=ns)

另一种选择是传递完整的XML路径，从根元素，但请记住每个步骤的名称空间前缀：

tree.findtext('ep:epoch/ep:endTime', namespaces=ns)

如果您有多个endTime元素，则可能的解决方案之一就是在循环中处理它们

这次findtext没有用，因为它只找到第一个匹配元素。您应该使用基于findall的循环，然后（在循环内）检索当前元素的文本并使用它， e、 g:

for it in tree.findall('ep:epoch/ep:endTime', namespaces=ns):
    print(it.text)

当然，用您需要的任何东西替换打印找到文本