我想请教一下如何解决泰瑟罗克无法从图像中识别出某些线条的问题。在
这是图像。源来自Simple Digit Recognition OCR in OpenCV-Python
代码
from PIL import Image
from tesserocr import PyTessBaseAPI, RIL
image = Image.open('test3.png')
with PyTessBaseAPI() as api:
api.SetImage(image)
boxes = api.GetComponentImages(RIL.TEXTLINE, True)
print 'Found {} textline image components.'.format(len(boxes))
for i, (im, box, _, _) in enumerate(boxes):
api.SetRectangle(box['x'], box['y'], box['w'], box['h'])
ocrResult = api.GetUTF8Text()
conf = api.MeanTextConf()
result = (u"Box[{0}]: x={x}, y={y}, w={w}, h={h}, "
"confidence: {1}, text: {2}").format(i, conf, ocrResult, **box)
print result
结果是这样的
^{pr2}$它不认识方框3中的号码。我应该添加或修改脚本以使方框3显示正确的结果?在
谢谢你的帮助。在
下面的代码有正确的OCR结果,但没有x,y,w,h和置信度信息。在
输出:
^{pr2}$在OSX Sierra中运行您的代码,结果与第4行丢失的结果相同。问题似乎是由
api.SetRectangle()
引起的,您可以将代码修改为print boxes
,以便进一步检查。示例代码只是基于您提供的示例文本图像,它需要使用更多图像进行测试,以验证它是否适合所有人。在希望这对你有用。在
使用默认的
Tesseract 4.00.00alpha
和oem 3
模式可以正确识别它。结果如下。在如果您仍在使用}。在
v3.x
,建议使用您的tesserocr
将tesseract
升级到{相关问题 更多 >
编程相关推荐