LXML-排序标记Ord

<X> <X01>1</X01> <X02>2</X02> <X03>3</X03> <A> <A01>X</A01> <A02>Y</A02> <A03>Z</A03> </A> <B> <B01>Z</B02> <B02>X</B02> <B03>C</B03> </B> </X>

2条回答

网友

1楼 · 编辑于 2024-09-27 20:18:31

您可以对xml元素进行如下排序：

from operator import attrgetter
from lxml import etree

root = etree.parse(xmlfile)
children = list(root)
sorted_list = sorted(children, key=attrgetter('tag'))

如果运行速度太慢，您可以对标记名进行排序，然后使用xpath获取节点：

tag_list = [item.tag for item in root]
sorted_taglist = sorted(tag_list)

网友

2楼 · 编辑于 2024-09-27 20:18:31

可以编写一个helper函数来在正确的位置插入一个新元素，但是如果不了解更多关于结构的信息，就很难使它成为泛型。

下面是对整个文档中的子元素进行排序的简短示例：

from lxml import etree

data = """<X>
    <X03>3</X03>
    <X02>2</X02>
    <A>
        <A02>Y</A02>
        <A01>X</A01>
        <A03>Z</A03>
    </A>
    <X01>1</X01>
    <B>
        <B01>Z</B01>
        <B02>X</B02>
        <B03>C</B03>
    </B>
</X>"""

doc = etree.XML(data,etree.XMLParser(remove_blank_text=True))

for parent in doc.xpath('//*[./*]'): # Search for parent elements
  parent[:] = sorted(parent,key=lambda x: x.tag)

print etree.tostring(doc,pretty_print=True)

屈服：

<X>
  <A>
    <A01>X</A01>
    <A02>Y</A02>
    <A03>Z</A03>
  </A>
  <B>
    <B01>Z</B01>
    <B02>X</B02>
    <B03>C</B03>
  </B>
  <X01>1</X01>
  <X02>2</X02>
  <X03>3</X03>
</X>

相关问题更多 >

编程相关推荐

热门问题

热门文章

LXML-排序标记Ord

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >