2024-10-01 09:24:10 发布
网友
我有多个交易收据,并试图从这些收据中提取发票金额。问题是我使用的ocr无法从文档中捕获一定数量的数据。我使用了pillow和pytesseract和pdf2image将pdf文档转换为图像,然后使用ocr从这些图像中提取数据。然后我将文本转换成ocrhtml文件,使用关键字和位置提取数据。但是,某些信息尚未从pdf中提取。请帮我解决这个问题。在
ocr
pytesseract
pdf2image
pdf
html
目前没有回答
目前没有回答
相关问题 更多 >
编程相关推荐