在python中，如何将word docx中的整个xml元素替换为字符串

2条回答

网友

1楼 · 编辑于 2024-09-30 22:21:13

这是不受python-docxAPI支持的。您需要以另一种方式编辑XML

python-docx可以让您以lxml.etree._Element对象的形式访问段落XML元素（<w:p>），然后您可以使用该API操作其子元素。基本思想是在找到w:sym元素的地方插入一个新的<w:t>元素，然后删除w:sym元素

lxml.etree._ElementAPI文档在这里：https://lxml.de/api/lxml.etree._Element-class.html。代码可能如下所示：

p = paragraph._p
for child_element in list(p):
    if child_element.tag != "w:sym":
        continue
    new_t_element = ...
    child_element.addprevious(new_t_element)
    p.remove(child_element)

还有一些细节需要解决，但希望这能给你一个追求的方向。一旦你解决了细节问题，也许你可以在这里发布你的解决方案

网友

2楼 · 编辑于 2024-09-30 22:21:13

如果您在python docx方面运气不佳，那么xsl 1.0是一种替代方案：

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0"  
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main">
  
  <!  Identity template : copy all text nodes, elements and attributes  >   
  <xsl:template match="@*|node()">
    <xsl:copy>
      <xsl:apply-templates select="@*|node()" />
    </xsl:copy>
  </xsl:template>
  
  <xsl:template match="w:sym[@w:font='Symbol' and @w:char='F0B3']">
    <w:t>≥</w:t>
  </xsl:template>
  
</xsl:stylesheet>

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中，如何将word docx中的整个xml元素替换为字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >