从PDF中提取表单数据(library或utly)

2024-05-18 08:44:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用一个库从PDF中提取表单数据,最好是一个打包在ubuntu中的免费软件库。在

例如,假设我有一个HTML表单,但是我也希望用户能够提交一个填好的PDF表单,而不是HTML表单。在

所以,我要找的是一个库(或简单的CLI实用程序),它接受PDF作为输入,并允许我按名称提取填充的字段,就像使用HTML一样。在

我尝试过pdftotext,但这并不能真正保存信息,它只是将PDF呈现为文本。我尝试了PDFminer,但它似乎根本不起作用(至少在我的测试PDF中是这样的)(只是得到了空输出)。在

如果它是一个库,我对这门语言不太挑剔,但python会是一个优势。在


Tags: 数据用户文本实用程序名称语言表单cli
1条回答
网友
1楼 · 发布于 2024-05-18 08:44:10

我正在使用pdftk来提取一些数据和操作pdf,但我不确定是否可以按照您需要的方式处理填充的表单。在

相关问题 更多 >