智能图像增强随机缩小

2024-10-03 17:28:21 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在建立一个CNN来识别面部关键点。我想让网络更加健壮，所以我考虑应用一些缩小变换，因为大多数图片的关键点位置大致相同，所以网络学习不多

我的方法：

我希望增强图像保持原始图像大小，因此应用MaxPool2d，然后随机（不相等）填充，直到达到原始大小

第一个问题

它是使用简单的平均填充还是零填充？我确信如果我让填充物看起来更像背景会更好，但是有没有一个简单的方法可以做到这一点

第二个问题

关键点是目标向量，它们以30的行向量的形式出现。我对将它们转换到更小空间所需的逻辑感到困惑。一般来说，如果一个原点位于（x=5，y=7），它将转换为（x=2，y=3）-我不确定，但到目前为止手动检查，它是正确的。但如果关键点位于同一个新像素中，该怎么办？我不能用更少的目标值为网络提供信息

就这样。我很高兴听到你的想法

Tags：方法图像网络目标空间图片逻辑向量

1条回答

网友

1楼 · 发布于 2024-10-03 17:28:21

我建议使用torchvision.transforms.RandomResizedCrop作为Compose语句的一部分。这将为您提供随机缩放，并将生成的图像调整为标准大小。这避免了两个问题中的问题