我希望从以下由2个发票组成的图像中提取键值对。你知道吗
图像示例
我使用AWS Textract来实现这一点,但是我希望能够将键值对映射回发票。例如,'Cornbread SVC'应映射到1号清单,'1#1 CHKN PLATE'应映射到2号清单。你知道吗
我认为一种方法是对图像进行一些预处理,如果我们能找出票据的数量和它们的坐标,然后根据尺寸裁剪图像。所以基本上一张图片上的5张钞票会得到5张钞票的坐标,然后把原始图片按照不同的钞票尺寸裁剪5次。然后将每张账单作为单独的图像发送到AWS Textract。你知道吗
然而,我还没有找到一种方法来检测图像中的票据数量及其边界坐标。你知道吗
任何帮助都将不胜感激。我愿意使用任何其他API或方法来实现这一点。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐