擅长:python、mysql、java
<p>从你的帖子中,观察到两个可能的问题。</p>
<ol>
<li><p>所有经过训练的语言数据都应该保存在<code>TESSDATA_PREFIX</code>,
一个Windows环境变量,在本例中位于<code>C:\Program Files
(x86)\Tesseract-OCR\tessdata</code>。</p></li>
<li><p>经过<code>tesseract</code>训练的英语数据被命名为<code>eng.traineddata</code>(即<code>'eng'</code>),除非修改其名称。有关详细信息,请参阅此<a href="https://github.com/tesseract-ocr/tesseract/wiki/Data-Files" rel="nofollow noreferrer">Tesseract Data Files</a>。</p></li>
</ol>
<p>此外,要使<code>pytesseract</code>读取图像文件<code>Image.open()</code>,如果无法找到图像文件,则可以包含完整的文件路径(例如<code>'z:\\path\\to\\image'</code>)。</p>
<p>希望如此。</p>