以jpg格式从python中的PDF中提取戳记

2024-10-01 07:37:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我有个问题。我需要从pdf中提取的一些图像不是作为图像到pdf,而是作为戳记。我得到了很多PDF文件,我想从这些PDF文件中提取所有邮票和所有图像(我有一个用于所有图像但不是所有邮票的脚本)。我只想要这些邮票的JPG,但我不知道如何解析这些PDF并以JPG格式提取所有邮票。我想在Python3中实现这一点

非常感谢! 问候,


Tags: 文件图像脚本pdf格式python3jpg问候
1条回答
网友
1楼 · 发布于 2024-10-01 07:37:05

使用use或pyMuPDF,您可以执行以下操作:

#!/usr/bin/python

import fitz

pdf_document = fitz.open("file.pdf")


for current_page in range(len(pdf_document)):
    for annot in pdf_document[current_page].annots():
            xref = annot.get_pixmap()
            xref.writePNG("page%s-%s.png" % (current_page, xref))

相关问题 更多 >