字符识别算法中消除冗余边界盒的有效方法

2024-05-19 19:28:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在研究如何同时应用不同的二值化算法来改进OCR系统的字符分割。 本质上,我应用了许多不同的算法和不同的参数,并使用CCA分别从每个算法中提取候选斑点。其思想是,不同的算法检测图像中的不同字符,它们的结合应该产生更准确的结果。 输出如下图所示:

example

# Where each color represents the result of a different binarization algo and 
# all bboxes are stored in the same array in format (topleft, bottomright) 
boxes = [box1,box2,...,box_n]

我现在想做的是在将候选区域发送到识别阶段之前消除冗余的边界框(类似于ML算法中的非最大值抑制,只是我没有置信度得分)。有没有一种有效的方法不需要我迭代每一对可能的盒子? 速度是一个很重要的因素,因为我正在使用Python,我希望它能够用于实时分析。你知道吗

本实验基于以下文章: 车牌字符分割二值化方法的最佳组合 作者:Yongwoo Yoon、Kyu-Dae Ban、Hosub Yoon、Jaeyeon Lee、Jaehong Kim


Tags: the方法in图像算法参数系统where