有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

如何从PDF文件中删除所有图像/图形,并仅在Java中保留文本?

我有一个PDF文件,它是OCR处理器的输出,这个OCR处理器识别图像,将文本添加到PDF中,但最后会放置一个低质量的图像,而不是原始图像(我不知道为什么有人会这样做,但他们会这样做)

所以,我想得到这个PDF文件,删除图像流,不处理文本,这样我就可以得到它并导入(使用iText页面导入功能)到一个我用真实图像自己创建的PDF文件中

在有人问我之前,我已经尝试使用另一个工具来提取文本坐标(JPedal),但当我在PDF上绘制文本时,它的位置与原始位置不同

我更希望用Java来完成,但是如果其他工具可以做得更好,请告诉我。这可能只是图像删除,我可以用PDF格式,里面有图纸


共 (0) 个答案