似乎有两种方法可以做到这一点,但似乎都不管用
首先,您可以传递tessedit_char_whitelist
,但这似乎只适用于字符,而不适用于模式:
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:\Users\.../tesseract.exe'
pytesseract.image_to_string(img, config="-c tessedit_char_whitelist=.{5,15}\d{4,8}")
这不起作用,尽管您可以将字符列为'abcdefgh'
白名单
第二种方式是this way。我已经找到了eng.user-patterns
文件,并输入了我的正则表达式模式,但我不知道如何设置它使其处于活动状态。我想应该是这样的:
pytesseract.image_to_string(img, configfile="eng.user-patterns")
但是,pytesseract
不接受这样的论点
tesseract不支持正则表达式,Pyteseract对此无能为力。 tessedit_char_白名单和用户模式是具有不同效果的不同参数
相关问题 更多 >
编程相关推荐