计算机视觉:图像比较与计数?

2024-06-26 19:42:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我很好奇,如果能计算出一张照片中的东西的数量,比如说鸭子的数量,先拍一张样本照片,然后在另一张照片中看到它匹配的地方。为了澄清这一点,我们将有两张图片(一张图片有一只鸭子,另一张图片有四只鸭子,为了便于讨论),程序将通过叠加一张鸭子图片来查看它在4只鸭子图片中可以匹配多少张图片,从而计算出图片中有多少只鸭子。我读了一点关于计算机视觉的文章,我知道opencv的网站讨论过使用傅立叶变换将图像分解成大小和相位。我希望能把一只鸭子的图片的大小转换成一个矩阵,然后把它和四只鸭子图片中的一系列矩阵进行比较。在

我想这是相当困难的,因为我必须告诉程序初始duck的形状,然后将duck的分解图像信息存储到一个矩阵中,然后将其与另一个图片中分解的矩阵进行比较。有什么想法/建议吗?我认为这是一个很好的学习经验,因为我是一个电气工程专业的学生,我上学期学了傅立叶变换,DFT等等。把它们实际应用到某些东西上会很酷。在


Tags: 图像程序数量地方计算机文章图片矩阵
1条回答
网友
1楼 · 发布于 2024-06-26 19:42:55

你说的是物体识别——计算机视觉中的一个基本问题。你的主要想法——拍一张物体的照片,从中获取一些特征,然后在其他图像上找到相同的特征集——是正确的。然而,逐像素比较(无论是在时域还是频域)是非常容易出错的,并且通常给出的结果很差。在大多数情况下,更高级的特性会产生更好的结果。在

首先,看看OpenCV中的Cascade Classifier,它使用类似Haar的特性(具有特定灰度的小矩形)。它最为人所知的是人脸检测和识别,但也可以用于其他物体的训练。在

您可能还对SURF方法感兴趣,该方法搜索具有相似特征的点,甚至AAMs,它试图为对象的形状和外观建模。在

相关问题 更多 >