在Python中,按照某个度量将PDF文件分成两列?

2024-10-03 17:22:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我有大量的PDF文件,分为两列。当我使用PyPDF2提取文本时,它读取整个第一列(类似于标题)和整个第二列。这样就不可能在标题上进行拆分。它分为两列:

帴 |第1列第2列
|第1列第2列
|第1列第2列
|第1列第2列
____悻

我想我需要沿着专栏的边缘将PDF文件分成两半,然后从左到右阅读每一列。它的宽度为2.26英寸,采用8x11 PDF格式。我也可以使用PyPDF2来获得坐标。在

有没有人有做这件事的经验或知道我会怎么做?在

编辑:当我使用PyPDF2提取文本时,输出没有空格:Col1Col1Col1Col1Col2Col2Col2Col2


Tags: 文件文本编辑标题宽度pdf格式经验