擅长:python、mysql、java
<p>好吧,我为我的问题找到了答案。看来泰瑟拉克不喜欢粗体字,所以你得稍微腐蚀一下黑体字。但是要注意<code>cv2.erode</code>会腐蚀字符的白色部分,所以我们必须使用<code>cv2.dilate</code>来达到这个目的。在</p>
<pre><code>for i in ['47-4].png', '55-S55.png', '90-IQ.png']:
img = cv2.imread(i, 0)
### After apply dilation using 3X3 kernal. The recognition results are improved.##
kernel = np.ones((3, 3), np.uint8)
img = cv2.dilate(img, kernel, iterations=2)
cv2.imwrite("./output/" + i[:-4]+'_dilate.png', img)
tessdata_dir_config = ' tessdata-dir "D:\Program Files\Tesseract-ocr\" psm 10'
result = pytesseract.image_to_string(Image.fromarray(img), config=tessdata_dir_config)
print result
</code></pre>
<p>我想看看对这个问题有没有更好的分析。所以我会让它打开一段时间,然后选择最好的答案。在</p>