用OCR/计算机视觉从图像中读取多张发票

2024-09-28 22:44:32 发布

男 | 程序猿一只，喜欢编程写python代码。

我希望从以下由2个发票组成的图像中提取键值对。你知道吗

图像示例 Click here for image

我使用AWS Textract来实现这一点，但是我希望能够将键值对映射回发票。例如，'Cornbread SVC'应映射到1号清单，'1#1 CHKN PLATE'应映射到2号清单。你知道吗

我认为一种方法是对图像进行一些预处理，如果我们能找出票据的数量和它们的坐标，然后根据尺寸裁剪图像。所以基本上一张图片上的5张钞票会得到5张钞票的坐标，然后把原始图片按照不同的钞票尺寸裁剪5次。然后将每张账单作为单独的图像发送到AWS Textract。你知道吗

然而，我还没有找到一种方法来检测图像中的票据数量及其边界坐标。你知道吗

任何帮助都将不胜感激。我愿意使用任何其他API或方法来实现这一点。你知道吗

Tags：方法图像 aws 示例数量尺寸图片发票

0条回答

目前没有回答