边界框检测后的OCR

2024-09-30 22:17:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图用python找出某些单词在不同书籍中出现的频率。为此,我试图找到每个单词周围的边界框。在

在输入:-https://www.dropbox.com/s/ib74y9wh2vrxlwi/textin.jpg

以及我在执行二值化和其他形态学操作以检测边界后得到的输出盒子:- https://www.dropbox.com/s/9q4x61dyvstu5ub/textout.png

我的问题是, 我需要用pytesser执行ocr。我当前的实现相当糟糕。我目前正在将检测到的每个边界框保存到小的png文件中,然后分别运行pytesser的代码,该代码将遍历每个包含单词的小图像。这个过程占用了我的系统。在

有没有其他方法可以直接将我的图像(由边界框检测到)直接输入pytesser而不必先保存它们?在

在我的代码运行之后,我有一个544个(在这个例子中)边界框的列表

                    [minrow, mincol, maxrow, maxcol].

Tags: 代码https图像compngwww单词dropbox