有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何对docx文件进行碎片整理,以便与ApachePOI3.8一起使用?

我正在努力寻找&;将docx文件中的文本段落替换为POI 3.8,如here所述

如果我在第一次运行时插入标签,效果就很好了。但是,只要我重新打开docx文件并进行一些修改,Word实际上会在文本中出现片段。例如,“hello world”可能是:

<w:r><w:t>Hello wo</w:t></w:r><w:r w:rsidR="00FB0672"><w:t>rld</w:t></w:r>

我认为,这种碎片化将是由于诸如更改跟踪、格式设置和拼写检查之类的事情造成的

有人知道如何

a)。。。是否在MS Word中禁用此功能

b)。。。不知何故,后来对docx文件进行了反分段

c)。。。有没有其他解决方案来消除这种碎片

我已经尝试将文件另存为。doc/。odt并将文件重新保存到。docx。但这些碎片仍然存在

非常感谢您的帮助-提前感谢您的帮助


共 (1) 个答案

  1. # 1 楼答案

    在Word中,您想要并且可以关闭的功能是拼写和语法检查,以及rsid插入

    这是针对docx4j(我管理的一个项目),而不是POI,但是VariablePrepare向您展示了如果您无法在Word中阻止它,那么需要做什么来消除片段。由于POI使用类似的XML编组/解编方法(尽管是XMLBeans,而不是JAXB),因此您应该能够将该代码转换为使用POIAPI