在python3中如何使用PyPDF2计算边界框

2024-10-01 00:20:44 发布

您现在位置:Python中文网/ 问答频道 /正文

这个问题与python3一起使用的PyPDF2有关

ghostscript显然能够有效地计算PDF页面内内容的边界框,如下所示:

gs -dBATCH -dSAFER -dNOPAUSE -sDEVICE=bbox document1.pdf

上例中返回的结果似乎是正确的,并且是:

^{pr2}$

我的问题是,边界框可以用PyPDF计算吗?如有,如有任何指导,请告知。我挖得很辛苦,但到目前为止还不知道怎么挖。在

我可以让PyPDF2给出mediaBox、cropBox、artBox和trimBox的坐标,但这些似乎与边界框无关。在


Tags: gs内容pdf页面python3边界bboxghostscript
1条回答
网友
1楼 · 发布于 2024-10-01 00:20:44

列出的框与页面对象关联。PyPDF2允许您访问和修改这些框的坐标。在

边界框是不相关的,这是正确的;一个页面可能没有或有多个边界框。我相信每个bbox代表一个图形、字体等的区域,而不是整个页面。在

为了回答您的问题,PyPDF2当前不提供对边界框坐标的访问。不过,这是一个值得考虑的问题。在

pyPdf和PyPDF2并不像页面处理那样关注特定的内容提取。但这是一个我们将研究开发的概念!在

相关问题 更多 >