java提取PDF中的表数 1 周,2 日 Questions & Answers 1040 我试图使用iText来找出使用java的pdf文件中存在的表的数量,但是没有成功,任何人都无法让我知道正确的查找方向
# 1 楼答案 如果您的PDF被标记,您可以检查StructTreeRoot中的表结构。如果您的PDF没有标记,则PDF中没有表格。你可以用肉眼看到表格,但就PDF文件而言,只有行和文本片段,没有表格 一个没有标记的PDF,对它的结构一无所知!从不包含StructTreeRoot的PDF中提取表格就像从胡萝卜汤中提取原始的完整胡萝卜一样。如果这就是你想要做的,那么希望我的比喻能解释为什么你在要求一些不可能的事情(这也解释了为什么你找不到任何答案) 如何确定PDF是否已被标记?在Adobe Reader中打开PDF,然后单击文件>;文档属性。在属性选项卡底部的某个地方,有一个条目指示标记的PDF:No或标记的PDF:Yes
# 1 楼答案
如果您的PDF被标记,您可以检查
StructTreeRoot
中的表结构。如果您的PDF没有标记,则PDF中没有表格。你可以用肉眼看到表格,但就PDF文件而言,只有行和文本片段,没有表格一个没有标记的PDF,对它的结构一无所知!从不包含
StructTreeRoot
的PDF中提取表格就像从胡萝卜汤中提取原始的完整胡萝卜一样。如果这就是你想要做的,那么希望我的比喻能解释为什么你在要求一些不可能的事情(这也解释了为什么你找不到任何答案)如何确定PDF是否已被标记?在Adobe Reader中打开PDF,然后单击文件>;文档属性。在属性选项卡底部的某个地方,有一个条目指示标记的PDF:No或标记的PDF:Yes