宠物食品图像分类模型

2024-10-04 01:26:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在制作一个CNN来检测不同类型的宠物食品。我希望模型能够告诉你,狗狗的图片是狗狗的还是猫的。我有大约500张属于每个班级的图片。我使用了一个预先训练过的模型(resnet.34)和python中的fastai来创建我的模型。我想知道我是否需要做一些图像分割以使模型准确。就像让模型将每个单独的kibble标识为不同的对象一样。因为目前,模型可能正在对实际kibble以外的属性进行预测。我知道,使用tensorflow,您可以将图像中存在的不同对象可视化。不知道fastai是如何做到这一点的。我将附加一些我在训练集中使用的数据的图像。 [kibble_train][1]kibbles_train


Tags: 对象模型图像类型属性可视化tensorflow图片
2条回答

不,您不需要使用分段。如果你的数据中有信号,CNN很可能会了解到,偏见也不会成为太大的问题

如果您担心其他因素(例如碗的类型)可能会影响您的算法,我认为您可以在分割之前做很多事情(这是一项非常艰巨的任务)。例如,您可以裁剪图片的中间正方形。这样,就只能看到那些碎片了

也就是说,仍然有很少的信息会影响你的算法。如果你看看流行的猫和狗数据集,有很多不必要的背景,但这是一个简单的分类任务

我同意你可能不需要为这个问题的图像分割,它肯定看起来像分类应该能够处理它。我同意Nicolas的观点,裁剪可能会有所帮助,但也许为训练展示裁剪/非裁剪的混合图像会帮助模特专注于kibble本身

在对图像进行训练/预测之前,我还将研究histogram equalization和/或可以应用于图像的其他调整。我注意到,在你的样本图片中,颜色差异一点也不突出。直方图均衡化将增加图像的整体对比度,使模型更容易识别差异。在转向更复杂的模型选项之前,我会研究这样的图像增强,因为它们的应用速度要快得多

相关问题 更多 >