如何在支票/支票图像中提取账号

2024-09-25 16:26:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在执行一个任务,从cheque images提取{}。我目前的方法可以分为两个步骤

  1. 本地化帐号数字(印刷数字)
  2. 使用OCR库执行OCR,如Tesseract OCR

第二步是直截了当地假设我们已经正确地本地化了帐号数字

我试图使用OpenCV轮廓方法和MSER(最大稳定极值区域)来定位帐号数字,但没有得到有用的结果。很难概括模式,因为

  • 不同的银行支票模板各不相同
  • 帐号位置不固定

我们如何处理这个问题。我需要寻找一些基于deep learning的方法吗。在

示例图像enter image description here


Tags: 方法定位区域模式步骤数字opencv轮廓
1条回答
网友
1楼 · 发布于 2024-09-25 16:26:28

假设帐号有唯一的紫色文本颜色,我们可以使用颜色阈值。其思想是将图像转换为HSV颜色空间,然后定义一个较低/较高的颜色范围,并使用cv2.inRange()执行颜色阈值。在此基础上,我们根据轮廓区域进行滤波以去除小噪声。最后我们反转图像,因为我们希望文本为黑色,背景为白色。最后一步是在将图像放入Pytesseract之前对图像进行高斯模糊处理。结果如下:

enter image description here

脓肿治疗的结果

30002010108841

代码

^{pr2}$

相关问题 更多 >