如何在python中无模式地从多个交易凭证中提取日期

2024-10-01 09:24:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我有多个交易收据,并试图从这些收据中提取发票金额。问题是我使用的ocr无法从文档中捕获一定数量的数据。我使用了pillow和pytesseractpdf2imagepdf文档转换为图像,然后使用ocr从这些图像中提取数据。然后我将文本转换成ocrhtml文件,使用关键字和位置提取数据。但是,某些信息尚未从pdf中提取。请帮我解决这个问题。在


Tags: 数据文档图像文本数量pdf交易发票