自动编码器重建缺少颜色

2024-10-05 14:27:03 发布

男 | 程序猿一只，喜欢编程写python代码。

我的目标是找到无监督的全身标志。为此，我使用一个自动编码器结构来分离全身图像的形状和外观（deep fashion数据集）。损失函数包含重建损失，这是一项辅助任务

如下图所示，地标的检测效果相当不错。然而，重建图像严重缺乏颜色多样性

在这张图片上，您可以看到两个输入图像-原始图像和图像的增强版本。两幅图像都需要重建。您可以按以下顺序查看图像：

输入图像-空间表示-检测到的关键点-重建-带有地标的原始图像-输入图像增强-等等

如您所见，增强图像的重建完全没有颜色。它根本没有绿色部分，即使损失是针对增强图像计算的。此外，重建未经整理的图像非常“干燥”

作为重建损失的损失函数，我在检测到的地标周围使用L1损失。我认为这可能是次优的。是否有人有想法，如何改进？是否有更适合重建的损失函数？我也尝试过L2损失，但没有改善

非常感谢

Tags：数据函数图像目标颜色标志编码器结构

0条回答

目前没有回答