从XML文档中有条件地删除元素问题的回答

从XML文档中有条件地删除元素

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我的任务是对python3中XML树的一些元素进行小的重构，即替换以下结构： <pre><code> <a href="http://www.google.com/"> http://www.google.com/ <img align="absmiddle" alt="" border="0" class="rendericon" height="7" src="http://jira.atlassian.com/icon.gif" width="7"/> </a> </code></pre> 有： ^{pr2}$ 即，如果整个结构与第一个示例中给出的结构完全对应，则删除sup元素。我需要在处理过程中保留XML文档，所以regexp匹配在某种程度上是不可能的。在 我已经有了适用于我目的的代码： <pre><code>doc = self.__refactor_links(doc) ... def __refactor_links(self, node): """Recursively seeks for links to refactor them""" for span in node.childNodes: replace = False if isinstance(span, xml.dom.minidom.Element): if span.tagName == "span" and span.getAttribute("class") == "nobr": if span.childNodes.length == 1: a = span.childNodes.item(0) if isinstance(a, xml.dom.minidom.Element): if a.tagName == "a" and a.getAttribute("href"): if a.childNodes.length == 2: aurl = a.childNodes.item(0) if isinstance(aurl, xml.dom.minidom.Text): sup = a.childNodes.item(1) if isinstance(sup, xml.dom.minidom.Element): if sup.tagName == "sup": if sup.childNodes.length == 1: img = sup.childNodes.item(0) if isinstance(img, xml.dom.minidom.Element): if img.tagName == "img" and img.getAttribute("class") == "rendericon": replace = True else: self.__refactor_links(span) if replace: a.removeChild(sup) return node </code></pre> 这个不会递归地遍历所有的标记-如果它与它所寻找的结构相匹配-即使它失败了，它也不会继续在这些元素中寻找结构，但在我的例子中，我不应该这样做（虽然这样做也很好，但在我看来，添加一堆else:self.\uu-refactor\u-links（tag）的成本会让它消失。在 如果任何条件失败，则不应执行任何移除操作。有没有更干净的方法来定义一组条件，避免大量的“如果”？一些自定义数据结构可以用来存储条件，例如（'sup'，（'img'，（…）），但我不知道应该如何处理它。如果你有任何建议或例子在python-请帮助。在 谢谢。在

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

从XML文档中有条件地删除元素

1 个回答

相关Python问题