我正在处理一些图像,在这些图像中,我必须执行一些预处理操作以删除任何内容并只保留文字。
为此,我使用了不同的阈值方法(自适应平均阈值、自适应高斯阈值…)。我得到的最好结果是自适应平均阈值。然而,使用自适应平均阈值不仅消除了不必要的“噪音”,而且还去除了部分文字!
这是我使用的代码:
src = cv2.imread('input.jpg', cv2.IMREAD_GRAYSCALE)
height, width = src.shape
blockSize = 35
C = 23
amtImage = cv2.adaptiveThreshold(src, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, blockSize, C)
cv2.imwrite('output.jpg', amtImage)
输入图像:出于保密原因,这些图像是从互联网上拍摄的!
我尝试使用以下代码消除虚线噪音:
^{pr2}$这是我得到的一个例子:
虽然自适应平均阈值效果良好,但最终结果仍不足以进行OCR-ed(使用Tesseract)。
有谁能建议一些修改或想法,以提高门槛的质量,并只保留文字在最后的图像?
对不起,太久了,谢谢你!在
目前没有回答
相关问题 更多 >
编程相关推荐