我想用一个库从PDF中提取表单数据,最好是一个打包在ubuntu中的免费软件库。在
例如,假设我有一个HTML表单,但是我也希望用户能够提交一个填好的PDF表单,而不是HTML表单。在
所以,我要找的是一个库(或简单的CLI实用程序),它接受PDF作为输入,并允许我按名称提取填充的字段,就像使用HTML一样。在
我尝试过pdftotext,但这并不能真正保存信息,它只是将PDF呈现为文本。我尝试了PDFminer,但它似乎根本不起作用(至少在我的测试PDF中是这样的)(只是得到了空输出)。在
如果它是一个库,我对这门语言不太挑剔,但python会是一个优势。在
我正在使用pdftk来提取一些数据和操作pdf,但我不确定是否可以按照您需要的方式处理填充的表单。在
相关问题 更多 >
编程相关推荐