有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java提取PDF中的表数

我试图使用iText来找出使用java的pdf文件中存在的表的数量,但是没有成功,任何人都无法让我知道正确的查找方向


共 (1) 个答案

  1. # 1 楼答案

    如果您的PDF被标记,您可以检查StructTreeRoot中的表结构。如果您的PDF没有标记,则PDF中没有表格。你可以用肉眼看到表格,但就PDF文件而言,只有行和文本片段,没有表格

    一个没有标记的PDF,对它的结构一无所知!从不包含StructTreeRoot的PDF中提取表格就像从胡萝卜汤中提取原始的完整胡萝卜一样。如果这就是你想要做的,那么希望我的比喻能解释为什么你在要求一些不可能的事情(这也解释了为什么你找不到任何答案)

    如何确定PDF是否已被标记?在Adobe Reader中打开PDF,然后单击文件>;文档属性。在属性选项卡底部的某个地方,有一个条目指示标记的PDF:No标记的PDF:Yes