基于属性值用lxml对子元素排序

2024-09-25 00:34:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图根据属性值对文档中的一些子元素进行排序,虽然实际排序的函数似乎可以工作,但新排序的元素的拼接似乎不起作用。在

from lxml import etree

def getkey(elem):
    # Used for sorting elements by @LIN.
    # returns a tuple of ints from the exploded @LIN value
    # '1.0' -> (1,0)
    # '1.0.1' -> (1,0,1)
    return tuple([int(x) for x in elem.get('LIN').split('.')])

xml_str = """<Interface>
                <Header></Header>
                <PurchaseOrder>
                    <LineItems>
                        <Line LIN="2.0"></Line>
                        <Line LIN="3.0"></Line>
                        <Line LIN="1.0"></Line>
                    </LineItems>
                </PurchaseOrder>
            </Interface>"""

root = etree.fromstring(xml_str)
lines = root.findall("PurchaseOrder/LineItems/Line")
lines[:] = sorted(lines, key=getkey)
res_lines = [x.get('LIN') for x in lines]
print res_lines

print etree.tostring(root, pretty_print=True)

当我执行上面的代码时,我会看到lines列表在打印['1.0', '2.0', '3.0']时没有正确排序。但是,XML树没有更新,因为tostring()打印出以下内容。在

^{pr2}$

我有了如何从http://effbot.org/zone/element-sort.htm排序的想法,它说拼接应该是我更新元素顺序所需的全部内容,但事实并非如此。我意识到lxml与elementtree不是100%兼容的,因此作为一个健全的检查,我用elementtree替换了lxml导入,得到了完全相同的结果。在


Tags: from元素for排序linerootlxmletree
1条回答
网友
1楼 · 发布于 2024-09-25 00:34:07

这将排序并写入输出:

import xml.etree.ElementTree as ET

tree = ET.parse("in.xml")

def getkey(elem):
    # Used for sorting elements by @LIN.
    # returns a tuple of ints from the exploded @LIN value
    # '1.0' -> (1,0)
    # '1.0.1' -> (1,0,1)
    return float(elem.get('LIN'))

container = tree.find("PurchaseOrder/LineItems")

container[:] = sorted(container, key=getkey)

tree.write("new.xml")

或使用您自己的代码打印:

^{pr2}$

输出:

In [12]: print (etree.tostring(root, pretty_print=True))
        <Interface>
            <Header/>
                <PurchaseOrder>
                    <LineItems>
                        <Line LIN="1.0"/>
                    <Line LIN="2.0"/>
                        <Line LIN="3.0"/>
                        </LineItems>
                </PurchaseOrder>
            </Interface>

关键是root.find("PurchaseOrder/LineItems"),您需要找到LineItems元素并对其排序。在

相关问题 更多 >