PyTesseract不识别小数

import cv2, pytesseract import numpy as np image = cv2.imread( '01.png' ) upscaled_image = cv2.resize(image, None, fx = 4, fy = 4, interpolation = cv2.INTER_CUBIC) bw_image = cv2.cvtColor(upscaled_image, cv2.COLOR_BGR2GRAY) kernel = np.ones((2, 2), np.uint8) dilated_image = cv2.dilate(bw_image, kernel, iterations=1) eroded_image = cv2.erode(dilated_image, kernel, iterations=1) thresh = cv2.threshold(eroded_image, 205, 255, cv2.THRESH_BINARY)[1] kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3)) morh_image = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel) blur_image = cv2.threshold(cv2.bilateralFilter(morh_image, 5, 75, 75), 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1] final_image = blur_image text = pytesseract.image_to_string(final_image, lang='eng', config='--psm 10')

2条回答

网友

1楼 · 编辑于 2024-09-28 16:22:17

我有一个类似的例子，通过使用图像处理方法和放大图像，我能够增加正确小数的数量。然而，一小部分小数没有被正确识别

我找到的解决方案是更改pytesseract的语言设置：

我使用的是非英语设置，但将配置更改为lang='eng'修复了所有剩余的问题

不过，这可能对原来的问题没有帮助，因为设置已经是eng

网友

2楼 · 编辑于 2024-09-28 16:22:17

如果您还没有确定这一点，请查看此链接

访问https://groups.google.com/g/tesseract-ocr/c/Wdh_JJwnw94/m/xk2ErJnFBQAJ

对于许多问题，一个主要的解决方案是文本高度，我曾面临许多问题，但无法找出原因，但向tesseract发送具有正确大小字母的图像似乎解决了许多问题。不要放大到随机的百分比，试试你的图像中字母接近30-40px的数字

此外，如果您的预处理以某种方式将“.”更改为类似于char的噪声，那么它也将被忽略

相关问题更多 >

编程相关推荐

热门问题

热门文章