如何删除XML-fi中的重复元素

<?xml version="1.0" encoding="utf-8"?> <ArrayOfHouse> <XmlForm> <houseNum>0</houseNum> <plan1> <coord> <X> 1.2 </X> <Y> 2.1 </Y> <Z> 3.0 </Z> </coord> <color> <R> 255 </R> <G> 0 </G> 0 </color> </plan1> <plan2> <coord> <X> 21.2 </X> <Y> 22.1 </Y> <Z> 31.0 </Z> </coord> <color> <R> 255 </R> <G> 0 </G> 0 </color> </plan2> </XmlForm> <XmlForm> <houseNum>0</houseNum> <plan1> <coord> <X> 1.2 </X> <Y> 2.1 </Y> <Z> 3.0 </Z> </coord> <color> <R> 255 </R> <G> 0 </G> 0 </color> </plan1> <plan2> <coord> <X> 21.2 </X> <Y> 22.1 </Y> <Z> 31.0 </Z> </coord> <color> <R> 255 </R> <G> 0 </G> 0 </color> </plan2> </XmlForm> <XmlForm> <houseNum>1</houseNum> <plan1> <coord> <X> 11.2 </X> <Y> 12.1 </Y> <Z> 13.0 </Z> </coord> <color> <R> 255 </R> <G> 255 </G> 0 </color> </plan1> <plan2> <coord> <X> 211.2 </X> <Y> 212.1 </Y> <Z> 311.0 </Z> </coord> <color> <R> 255 </R> <G> 0 </G> 255 </color> </plan2> </XmlForm> </ArrayOfHouse>

1条回答

网友

1楼 · 发布于 2024-10-16 17:27:07

考虑一下XSLT，这是一种专门用来转换XML文件的语言（类似于使用SQL查询数据库）。而且因为您已经使用了Python的lxml，您可以无缝地运行这样一个脚本，而不需要一个for循环或if逻辑来删除文档中任何地方的重复。在

具体地说，运行Muenchian Grouping（一种XSLT1.0方法），使用<xsl:key>通过houseNum索引XML文档，然后返回不同的分组。另一个好处是，下面的XSLT甚至可以用漂亮的打印缩进删除文本节点中的空白：

XSLT（另存为.xsl文件，一个特殊的.xml文件）

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output indent="yes" method="xml"/>
  <xsl:strip-space elements="*"/>

  <xsl:key name="id" match="XmlForm" use="houseNum" />

  <xsl:template match="@*|node()">
    <xsl:copy>
      <xsl:apply-templates select="@*|node()"/>
    </xsl:copy>
  </xsl:template>

  <xsl:template match="XmlForm[generate-id() != generate-id(key('id', houseNum))]"/>

  <xsl:template match="text()">
    <xsl:value-of select="normalize-space(.)"/>
  </xsl:template>

</xsl:stylesheet>

Python

^{pr2}$
输出
<?xml version="1.0"?> <ArrayOfHouse> <XmlForm> <houseNum>0</houseNum> <plan1> <coord> <X>1.2</X> <Y>2.1</Y> <Z>3.0</Z> </coord> <color> <R>255</R> <G>0</G> 0 </color> </plan1> <plan2> <coord> <X>21.2</X> <Y>22.1</Y> <Z>31.0</Z> </coord> <color> <R>255</R> <G>0</G> 0 </color> </plan2> </XmlForm> <XmlForm> <houseNum>1</houseNum> <plan1> <coord> <X>11.2</X> <Y>12.1</Y> <Z>13.0</Z> </coord> <color> <R>255</R> <G>255</G> 0 </color> </plan1> <plan2> <coord> <X>211.2</X> <Y>212.1</Y> <Z>311.0</Z> </coord> <color> <R>255</R> <G>0</G> 255 </color> </plan2> </XmlForm> </ArrayOfHouse>

相关问题更多 >

编程相关推荐

热门问题

热门文章