擅长:python、mysql、java
<ul>
<li><p>Tesseract是一个OCR引擎。它由Google使用、开发和资助,专门用于从图像中读取文本、执行基本文档分割和操作特定的图像输入(单个单词、行、段落、页面、有限字典等)。</p></li>
<li><p>另一方面,OpenCV是一个计算机视觉库,它包含一些特性,这些特性允许您执行一些特征提取和数据分类。您可以创建一个简单的字母分段器和分类器来执行基本的OCR,但它不是一个很好的OCR引擎(我以前在Python中从头开始就做了一个)。对于偏离训练数据的输入来说,这是非常不准确的)。</p></li>
</ul>
<p>如果你想基本了解OCR有多难,可以试试OpenCV。Tesseract用于<em>real</em>OCR。</p>