如何限制tesserocr中可识别的字符?

2024-09-27 07:17:31 发布

您现在位置:Python中文网/ 问答频道 /正文

在使用tesserocr时,如何将Tesseract能够识别的字符集限制为数字?在

我从this知道,如果我使用c++的话,我可以在配置文件中设置一个tessedit_char_白名单,但是我不知道Python中tesserocr中类似的方法。在

一般来说,如果读者已经知道c++的Tesseract API,tesserocr documentation会提供帮助。由于我不太精通c++,所以我希望避免为了使用tesserocr而不得不阅读c++源代码。在

如果有人能告诉我用python编写的东西,或者提供从配置设置到python代码的一般规则,那就太好了。提前谢谢。在


Tags: 方法代码api源代码规则documentation配置文件数字
1条回答
网友
1楼 · 发布于 2024-09-27 07:17:31

TSSECOR作为C++ API,可以设置一个白函数,函数^ {CD1>}。在

例如:

from tesserocr import PyTessBaseAPI
from string import digits

with PyTessBaseAPI() as api:
    api.SetVariable('tessedit_char_whitelist', digits)
    api.SetImageFile('image.png')
    print api.GetUTF8Text()  # it will print only digits

如果您想使用另一种更直接和独立于C++ API的方法,请尝试使用pytesseract模块。在

pytesseract示例:

^{pr2}$

相关问题 更多 >

    热门问题