Keras初学者：最后一层的输出形状应该是什么？

nn = Sequential() nn.add(Conv2D(8,(3,3), input_shape = (IMG_HEIGHT, IMG_WIDTH, 3), activation = 'relu', padding = 'same')) nn.add(Conv2D(8, (3,3), activation='relu', padding='same')) nn.add(Dense(1, activation='softmax'))

1条回答

网友

1楼 · 发布于 2024-07-04 08:05:36

Dense上的documentation不是最清晰的，但从描述输入和输出形状的部分可以清楚地看到。在

Note: if the input to the layer has a rank greater than 2, then it is flattened prior to the initial dot product with kernel.
...
Input shape
nD tensor with shape: (batch_size, ..., input_dim). The most common situation would be a 2D input with shape (batch_size, input_dim).
Output shape
nD tensor with shape: (batch_size, ..., units). For instance, for a 2D input with shape (batch_size, input_dim), the output would have shape (batch_size, units).

这是非常令人困惑的，因为它讨论了高阶张量将如何首先被展平（这使得您认为{}的总体输出将是批处理中每个示例的纯标量值），但是正如您从{}打印输出所示，它保持了张量的相同中间维。在

因此，如果你给一个输入是(None, 640, 959, 8)，这意味着{}将把最后一个维度作为一个完整的连接来处理，并将把内部维度指定的640x959个位置中的每一个单独的单元视为一个单独的输出神经元。。。在

如果你的网络是这样的：

nn = Sequential()
nn.add(Conv2D(8, (3,3), input_shape = (640, 959, 3), activation='relu', padding='same'))
nn.add(Conv2D(8, (3,3), activation='relu', padding='same'))
nn.add(Dense(1, activation='softmax'))

那么最终的输出形状将是

^{pr2}$

也就是说，640x959网格中的每个输出“像素”（i，j）被计算为上一层的点（i，j）处的8个不同卷积信道的密集组合。在

有多种方法可以实现相同的功能，例如将通道尺寸从8降到1的1x1卷积也会产生相同的输出形状，其层类似于

Conv2D(1, (1,1), activation='relu', padding='same')

或者您可以参考您正在进行的特定Kaggle竞赛的"naive Keras" example，它使用以下内容：

model = Sequential()
model.add( Conv2D(16, 3, activation='relu', padding='same', input_shape=(320, 480, 12) ) )
model.add( Conv2D(32, 3, activation='relu', padding='same') )
model.add( Conv2D(1, 5, activation='sigmoid', padding='same') )

除此之外，我们还有两个问题，即您为我们打印的代码中的数据维度不正确。在

一种情况是，您声明图像高度为440，但keras输出为640。在

另一个原因是最终的密集层在输出中有6个通道，但是您提供的相应代码只能导致1个通道。在

所以很可能您使用的代码和粘贴在这里的代码之间仍然存在一些不匹配，这使得我们无法看到维度问题的全部问题。在

例如，这个网络的丢失层应该将汽车位置像素的基本真实位掩码与最后一层的640x959Dense输出进行比较（一旦你解决了在输出中显示6个通道的奇怪问题）。在

但你报告的错误信息是

ValueError: Error when checking target: expected dense_1 to have 4 dimensions, but got array with shape (159, 640, 959)

这意味着这批目标数据可能需要被重塑成形状(159, 640, 959, 1)的张量，只是为了与来自Dense层的形状一致。在

相关问题更多 >

编程相关推荐

热门问题

热门文章