使用lxm从python中的xml中删除名称空间和前缀

metadata = '/Users/user1/Desktop/Python/metadata.xml' from lxml import etree parser = etree.XMLParser(remove_blank_text=True) open(metadata) tree = etree.parse(metadata, parser) root = tree.getroot() tree.write('/Users/user1/Desktop/Python/done.xml', pretty_print = True, xml_declaration = True, encoding = 'UTF-8')

3条回答

网友

1楼 · 编辑于 2024-05-05 12:48:32

import xml.etree.ElementTree as ET
def remove_namespace(doc, namespace):
    """Remove namespace in the passed document in place."""
    ns = u'{%s}' % namespace
    nsl = len(ns)
    for elem in doc.getiterator():
        if elem.tag.startswith(ns):
            elem.tag = elem.tag[nsl:]

metadata = '/Users/user1/Desktop/Python/metadata.xml'
tree = ET.parse(metadata)
root = tree.getroot()

remove_namespace(root, u'http://apple.com/itunes/importer')
tree.write('/Users/user1/Desktop/Python/done.xml',
       pretty_print=True, xml_declaration=True, encoding='UTF-8')

使用了here中的代码片段通过搜索以“xmlns”开头的标记，可以很容易地扩展此方法以删除任何命名空间属性

网友

2楼 · 编辑于 2024-05-05 12:48:32

>>> root.tag
'{http://latest/nmc-omc/cmNrm.doc#measCollec}measCollecFile'
>>> etree.QName(root.tag).localname
'measCollecFile'

source

附录：lxml.etree.QName也接受构造元素。因此etree.QName(root.tag).localname相当于：

etree.QName(root).localname

网友

3楼 · 编辑于 2024-05-05 12:48:32

按照Uku Loskit的建议更换标签。除此之外，还可以使用lxml.objectify.deannotate。

from lxml import etree, objectify

metadata = '/Users/user1/Desktop/Python/metadata.xml'
parser = etree.XMLParser(remove_blank_text=True)
tree = etree.parse(metadata, parser)
root = tree.getroot()

####    
for elem in root.getiterator():
    if not hasattr(elem.tag, 'find'): continue  # (1)
    i = elem.tag.find('}')
    if i >= 0:
        elem.tag = elem.tag[i+1:]
objectify.deannotate(root, cleanup_namespaces=True)
####

tree.write('/Users/user1/Desktop/Python/done.xml',
           pretty_print=True, xml_declaration=True, encoding='UTF-8')

更新

某些标记（如Comment）在访问tag属性时返回函数。增加了一个守卫。（一）

相关问题更多 >

编程相关推荐

热门问题

热门文章