用OCR/计算机视觉从图像中读取多张发票

2024-09-28 22:44:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我希望从以下由2个发票组成的图像中提取键值对。你知道吗

图像示例 Click here for image

我使用AWS Textract来实现这一点,但是我希望能够将键值对映射回发票。例如,'Cornbread SVC'应映射到1号清单,'1#1 CHKN PLATE'应映射到2号清单。你知道吗

我认为一种方法是对图像进行一些预处理,如果我们能找出票据的数量和它们的坐标,然后根据尺寸裁剪图像。所以基本上一张图片上的5张钞票会得到5张钞票的坐标,然后把原始图片按照不同的钞票尺寸裁剪5次。然后将每张账单作为单独的图像发送到AWS Textract。你知道吗

然而,我还没有找到一种方法来检测图像中的票据数量及其边界坐标。你知道吗

任何帮助都将不胜感激。我愿意使用任何其他API或方法来实现这一点。你知道吗


Tags: 方法图像aws示例数量尺寸图片发票