擅长:python、mysql、java
<p>如果要使用新字体训练tesseract,请使用所需字体生成.traineddata文件。要生成.traineddata,首先需要.tiff文件和.box文件。您可以使用<a href="https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/" rel="nofollow noreferrer">jTessBoxEditor</a>创建这些文件。jBossTextEditor的教程是<a href="http://vietocr.sourceforge.net/training.html" rel="nofollow noreferrer">here</a>。制作.tiff文件时,您可以设置使用的字体。您可以使用jTessBoxEditor生成.traineddata,也可以使用<a href="https://code.google.com/archive/p/serak-tesseract-trainer/downloads" rel="nofollow noreferrer">serak-tesseract-trainer</a>生成。我已经使用了这两种方法,我想说的是,对于生成tiff和box文件,jTessBoxEditor非常好,对于培训tesseract,可以使用serak</p>