如何将正则表达式模式传递给Pytesseract?

2024-09-27 07:34:49 发布

您现在位置:Python中文网/ 问答频道 /正文

似乎有两种方法可以做到这一点,但似乎都不管用

首先,您可以传递tessedit_char_whitelist,但这似乎只适用于字符,而不适用于模式:

import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:\Users\.../tesseract.exe'

pytesseract.image_to_string(img, config="-c tessedit_char_whitelist=.{5,15}\d{4,8}")

这不起作用,尽管您可以将字符列为'abcdefgh'白名单

第二种方式是this way。我已经找到了eng.user-patterns文件,并输入了我的正则表达式模式,但我不知道如何设置它使其处于活动状态。我想应该是这样的:

pytesseract.image_to_string(img, configfile="eng.user-patterns")

但是,pytesseract不接受这样的论点


Tags: to方法imageimgstring模式字符eng

热门问题