智能图像增强随机缩小

2024-10-03 17:28:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在建立一个CNN来识别面部关键点。我想让网络更加健壮,所以我考虑应用一些缩小变换,因为大多数图片的关键点位置大致相同,所以网络学习不多

我的方法:

我希望增强图像保持原始图像大小,因此应用MaxPool2d,然后随机(不相等)填充,直到达到原始大小

第一个问题

它是使用简单的平均填充还是零填充?我确信如果我让填充物看起来更像背景会更好,但是有没有一个简单的方法可以做到这一点

第二个问题

关键点是目标向量,它们以30的行向量的形式出现。我对将它们转换到更小空间所需的逻辑感到困惑。 一般来说,如果一个原点位于(x=5,y=7),它将转换为(x=2,y=3)-我不确定,但到目前为止手动检查,它是正确的。但如果关键点位于同一个新像素中,该怎么办?我不能用更少的目标值为网络提供信息

就这样。我很高兴听到你的想法


Tags: 方法图像网络目标空间图片逻辑向量
1条回答
网友
1楼 · 发布于 2024-10-03 17:28:21

我建议使用torchvision.transforms.RandomResizedCrop作为Compose语句的一部分。这将为您提供随机缩放,并将生成的图像调整为标准大小。这避免了两个问题中的问题

相关问题 更多 >