OCR应用前的图像清理

4条回答

网友

1楼 · 编辑于 2024-09-29 02:15:47

事实证明，^{}wiki有一篇文章以我能想象到的最佳方式回答了这个问题：

关于"Improving the quality of the [OCR] output"的图解指南。
问题"image processing to improve tesseract OCR accuracy"也可能引起兴趣。

（初步答案，仅供参考）

我没有用过PyTesser，但是我用tesseract（版本：3.02.02）做了一些实验。

如果对彩色图像调用tesseract，则它首先应用全局Otsu's method对其进行二值化，然后在二值（黑白）图像上运行实际的字符识别。

图像来自：http://scikit-image.org/docs/dev/auto_examples/plot_local_otsu.html

Otsu's threshold illustration

可以看出，“全球大津”未必总能产生令人满意的结果。

为了更好地理解tesseract“看到”的是将Otsu的方法应用到您的图像，然后查看结果图像。

总之：提高识别率的最直接的方法是自己对图像进行二值化（很可能通过反复试验找到了好的阈值），然后将这些二值化的图像传递给tesseract。

有人很好地发布了api docs for tesseract，因此可以验证以前关于处理管道的语句：ProcessPage->；GetThresholdedImage->；ThresholdToPix->；OtsuThresholdRectToPix

网友

2楼 · 编辑于 2024-09-29 02:15:47

我知道这不是一个完美的答案。但我想和大家分享一段我从Pycon2013上看到的可能适用的视频。它有点缺乏实现细节，但可能只是对如何解决/改进问题的一些指导/启发。

Link to Video

Link to Presentation

如果你决定使用ImageMagick对源图像进行一些预处理。Here是一个问题，它为您指出了很好的python绑定。

旁注。泰瑟雷克很重要。你需要对它进行训练，否则它不会像它所能做到的那样好/准确。

网友

3楼 · 编辑于 2024-09-29 02:15:47

不确定你的目的是否是为了商业用途，但这会让你怀疑你是否在一堆类似的图片上执行OCR。

http://www.fmwconcepts.com/imagemagick/textcleaner/index.php

原件 ORIGINAL

在使用给定参数进行预处理之后。

After Pre-Processing with given arguments.

网友

4楼 · 编辑于 2024-09-29 02:15:47

事实证明，^{}wiki有一篇文章以我能想象到的最佳方式回答了这个问题：

关于"Improving the quality of the [OCR] output"的图解指南。
问题"image processing to improve tesseract OCR accuracy"也可能引起兴趣。

（初步答案，仅供参考）

我没有用过PyTesser，但是我用tesseract（版本：3.02.02）做了一些实验。

如果对彩色图像调用tesseract，则它首先应用全局Otsu's method对其进行二值化，然后在二值（黑白）图像上运行实际的字符识别。

图片来源：http://scikit-image.org/docs/dev/auto_examples/plot_local_otsu.html

Otsu's threshold illustration

可以看出，“全球大津”未必总能产生令人满意的结果。

为了更好地理解tesseract“看到”的是将Otsu的方法应用到您的图像，然后查看结果图像。

总之：提高识别率的最直接的方法是自己对图像进行二值化（很可能通过反复试验找到了好的阈值），然后将这些二值化的图像传递给tesseract。

有人很好地发布了api docs for tesseract，因此可以验证以前关于处理管道的语句：ProcessPage->；GetThresholdedImage->；ThresholdToPix->；OtsuThresholdRectToPix

相关问题更多 >

编程相关推荐

热门问题

热门文章