tesseract给出了高度不一致的结果

public String getImgText(String imageLocation) { ITesseract instance = new Tesseract(); try { instance.setDatapath("/tessdata"); instance.setLanguage("eng"); String imgText = instance.doOCR(new File(imageLocation)); return imgText; } catch (TesseractException e) { e.getMessage(); return "Error while reading image"; } }

unnl lE mam-m m, mun-m, 1 ms "mm M W urn-mm my A mm“ m mus-1mm 1 m- m m mﬁnlln um: ”mu“ m ilk-M m. mwnm mu 5 mm nu- ..mn. n w. tvhrzmr- m 2 rm.“- 0 w, mama: m. mum-mp 5 mu mum n. a bulb-h» m tum-3mm nun mm,” M 3 mmn m; mum“ M Ema W 7 a“. m mzsm 5m mm»... m Continue

1条回答

网友

1楼 · 发布于 2024-10-02 00:29:45

在运行Tesseract（带有opencv库的python代码）之前，应预处理图像：

import cv2

img = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
result = cv2.bitwise_not(img)
result[result >= 190] = 255

# To show the image
cv2.imshow("Threshold", result)
cv2.waitKey()

结果是这样的：

此外，英语traineddata似乎对PUBG字体的处理很差，因此您可能需要对其进行微调： Training eng.traineddata for PUBG font

相关问题更多 >

编程相关推荐

热门问题

热门文章