如何从文档中删除所有肖像图片

2024-10-01 19:20:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在OCR文件图像工作。我要检测所有图片并从文档图像中删除。我想在文档图像中保留表。一旦我检测到图片,我会删除,然后想OCR。我试着寻找轮廓,试着探测所有更大的区域。不幸的是,它也检测表。以及如何删除文档图像中保留其他数据的对象。我正在使用opencv和python

This is my document Image

这是我的密码

import os
from PIL import Image
import pytesseract

img = cv2.imread('block2.jpg' , 0)
mask = np.ones(img.shape[:2], dtype="uint8") * 255


ret,thresh1 = cv2.threshold(img,127,255,0)
contours, sd = cv2.findContours(thresh1,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)

areacontainer = []

for cnt in contours:
    area = cv2.contourArea(cnt)
    areacontainer.append(area)

avgArea = sum(areacontainer)/len(areacontainer)

    [enter code here][1]

for c in contours:# average area heuristics
    if cv2.contourArea(c)>6*avgArea:
        cv2.drawContours(mask, [c], -1, 0, -1)

binary = cv2.bitwise_and(img, img, mask=mask) # subtracting
cv2.imwrite("bin.jpg" , binary)
cv2.imwrite("mask.jpg" , mask) 

Tags: 文档图像importimgfor图片maskarea
1条回答
网友
1楼 · 发布于 2024-10-01 19:20:21

这里有一个方法:

  • 将图像转换为灰度和高斯模糊
  • 执行canny边缘检测
  • 执行形态学操作以平滑图像
  • 找到轮廓并使用最小/最大阈值区域进行过滤
  • 删除纵向图像

这是检测到的以绿色突出显示的肖像

enter image description here

现在我们有了边界框roi,我们可以通过填充白色来有效地移除图片。结果是这样的

enter image description here

import cv2

image = cv2.imread('1.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray, (3,3), 0)
canny = cv2.Canny(blur, 120, 255, 1)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
close = cv2.morphologyEx(canny, cv2.MORPH_CLOSE, kernel, iterations=2)

cnts = cv2.findContours(close, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

for c in cnts:
    area = cv2.contourArea(c)
    if area > 15000 and area < 35000:
        x,y,w,h = cv2.boundingRect(c)
        cv2.rectangle(image, (x, y), (x + w, y + h), (255,255,255), -1)

cv2.imshow('image', image)
cv2.waitKey()

相关问题 更多 >

    热门问题