自动编码器重建缺少颜色

2024-10-05 14:27:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我的目标是找到无监督的全身标志。为此,我使用一个自动编码器结构来分离全身图像的形状和外观(deep fashion数据集)。损失函数包含重建损失,这是一项辅助任务

如下图所示,地标的检测效果相当不错。然而,重建图像严重缺乏颜色多样性

enter image description here

在这张图片上,您可以看到两个输入图像-原始图像和图像的增强版本。两幅图像都需要重建。您可以按以下顺序查看图像:

输入图像-空间表示-检测到的关键点-重建-带有地标的原始图像-输入图像增强-等等

如您所见,增强图像的重建完全没有颜色。它根本没有绿色部分,即使损失是针对增强图像计算的。此外,重建未经整理的图像非常“干燥”

作为重建损失的损失函数,我在检测到的地标周围使用L1损失。我认为这可能是次优的。是否有人有想法,如何改进?是否有更适合重建的损失函数?我也尝试过L2损失,但没有改善

非常感谢


Tags: 数据函数图像目标颜色标志编码器结构