如何在使用pytesseract时设置config load\u system\u dawg来改善结果?

2024-06-13 09:31:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图通过使用pytesseract config更改参数来改进结果。我想知道是否有可能改变load_system_dawg和load_freq_dawg在https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality#page-segmentation-method中的规定,因为我想得到的单词不是真正的英语,而是XYZ###和其他一些独特的字母序列。请参见屏幕截图

minecraft screenshot

我可以调整--psm的配置,但如果我尝试--load\u system\u dawg 0,则会得到没有此类命令行参数的错误或文件不存在的错误。我不知道,好像值得一试。。。你知道吗

params = r'--psm 11'
string = pytesseract.image_to_string(img, config = params)

我假设没有一种方法可以通过Python来完成,但是如果我能直接指导如何改变它,我会很感激它,因为我对C++的了解不多。此更改将通过pytesseract初始化吗?此外,我也尝试过改变用户模式,但不确定这是否是更好的方法


Tags: 方法httpsgithubconfig参数string错误load