所以我想要OCR一个有文本的图像
但是输出总是很奇怪,与图片中的文本不匹配。
因此,我决定更改图像属性。
我这样改变它:
image = cv2.imread("./image_frames/frame473.png")
def get_grayscale(image):
return cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
def blur(image):
return cv2.medianBlur(image,3)
def thresholding(image):
return cv2.threshold(image, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]
gray = get_grayscale(image)
# edges = cv2.Canny(gray, 60, 120)
thre= thresholding(blur)
blur = blur(thre)
cv2.imwrite("frame2.png", blur)
结果是这样的
即使我更改了它,OCR结果仍然是相同的结果。有人有办法吗?
我非常感谢您的回答,提前谢谢
您可以尝试应用中给出的预处理步骤-
https://tesseract-ocr.github.io/tessdoc/ImproveQuality
然后将预处理后的图像交给Google Tesseract OCR。我相信它会识别文本的
相关问题 更多 >
编程相关推荐