如何在OpenCV中实现imbinalize问题的回答

如何在OpenCV中实现imbinalize

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我在Matlab中开发了一个脚本，它分析了一幅彩色画上的雕刻文本。我正在使用一系列的形态学技术来提取文本并用OCR阅读。我需要在Raspberry Pi上实现它，因此我决定将我的Matlab代码转换成OpenCV（python语言）。我试着转移一些方法，它们的工作原理是相似的，但是我如何实现imreconstruct和imbinalize（如下所示）到OpenCV？（这里的挑战是适当区分前景和背景）。在 也许我应该尝试添加<code>grabCut</code>或<code>getStructuringElement</code>或{<cd3>}或{<cd4>}？我尝试了各种组合，但没有找到完美的解决方案。在 我将把整个脚本两者如果有人能给我建议，一般如何提高这种提取和OCR过程的准确性，我将不胜感激。在 <blockquote> Based on bin values of grey-scale image. I change some parameters in those functions: Matlab: </blockquote> <pre><code>se = strel('disk', 300); img = imtophat(img, se); maker = imerode(img, strel('line',100,0)); %for whiter ones maker = imerode(img, strel('line',85,0)); %for medium maker = imerode(img, strel('line',5,0)); imgClear = imreconstruct(maker, img); imgBlur = imgaussfilt(imgClear,1); %less blur for whiter frames BW = imbinarize(imgBlur,'adaptive','ForegroundPolarity','Bright',... 'Sensitivity',0.7); %process for medium BW = imbinarize(imgBlur, 'adaptive', 'ForegroundPolarity',... 'Dark', 'Sensitivity', 0.4); % process for black and white res = ocr(BW, 'CharacterSet', '0123456789', 'TextLayout', 'Block'); res.Text; </code></pre> <blockquote> OpenCv </blockquote> ^{pr2}$ 以下是输入图像： <a href="https://i.stack.imgur.com/wokvz.jpg" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/wokvz.jpg" alt="enter image description here"/></a> <a href="https://i.stack.imgur.com/DG5qn.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/DG5qn.png" alt="Matlab outcome (result 573702)"/></a> <a href="https://i.stack.imgur.com/TrDsy.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/TrDsy.png" alt="OpenCV outcome (result 573102"/></a> <a href="https://i.stack.imgur.com/ljr5c.jpg" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/ljr5c.jpg" alt="Light colour image"/></a> <a href="https://i.stack.imgur.com/7b3sb.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/7b3sb.png" alt="Matlab process full detection rate"/></a>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

当matlab和opencv似乎都使用相同的算法时，它们之间的差别有多大，我感到惊讶。为什么要运行<code>imbinarize</code>两次？sensitivity关键字的实际作用是什么（从数学上讲，在后台）。因为它们显然比光秃秃的大冢还要多出好几步。在 <pre><code>import cv2 import numpy as np import matplotlib.pyplot as plt def show(img): plt.imshow(img, cmap="gray") plt.show() img = cv2.imread("letters.jpg", cv2.IMREAD_GRAYSCALE) kernel = np.ones((3,3), np.uint8) blur = cv2.GaussianBlur(img,(3,3), 0) erosion = cv2.erode(blur, kernel, iterations=3) opening = cv2.dilate(erosion, kernel) th3 = cv2.adaptiveThreshold(opening, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 45, 2) show(th3) kernel2 = cv2.getGaussianKernel(6, 2) #np.ones((6,6)) kernel2 = np.outer(kernel2, kernel2) th3 = cv2.dilate(th3, kernel2) th3 = cv2.erode(th3, kernel) show(th3) </code></pre> 显示的图像包括： <a href="https://i.stack.imgur.com/K6eRd.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/K6eRd.png" alt="First image, the immediate result of thresholding"/></a> 经过一番清理： <a href="https://i.stack.imgur.com/adieh.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/adieh.png" alt="A bit more cleaned up and lean. Not really as nice as matlab output."/></a> 所以总的来说不一样，当然也没有matlab好。但基本原理似乎是一样的，只是数字需要玩玩。在 一个更好的方法可能是用图像的平均值来做一个阈值，然后用它的输出作为掩模来自适应阈值化原始图像。希望结果会比opencv和matlab都好。在 试着用自适应的THRESH做这个，你可以得到一些非常好的结果，但是周围有更多的垃圾。同样，如果你可以用它作为一个遮罩来隔离文本，然后再做一次tresholding，它可能会更好。同时，侵蚀和膨胀的核的形状也会造成很大的不同。在

如何在OpenCV中实现imbinalize

1 个回答

相关Python问题