2024-09-28 22:29:02 发布
网友
我想知道在Keras中活化层和致密层有什么区别。
既然激活层看起来是一个完全连接的层,而稠密层有一个传递激活函数的参数,那么什么是最佳实践?
让我们想象一下这样一个虚构的网络: 输入->;密集->;退出->;最终层 最后一层应该是:密集(激活=软最大)还是激活(软最大)? 什么是最干净的?为什么?
谢谢大家!
使用Dense(activation=softmax)在计算上等同于首先添加Dense,然后添加Activation(softmax)。然而,第二种方法有一个优点——您可以从这样定义的模型中检索最后一层(激活前)的输出。在第一种方法中-这是不可能的。
Dense(activation=softmax)
Dense
Activation(softmax)
使用
Dense(activation=softmax)
在计算上等同于首先添加Dense
,然后添加Activation(softmax)
。然而,第二种方法有一个优点——您可以从这样定义的模型中检索最后一层(激活前)的输出。在第一种方法中-这是不可能的。相关问题 更多 >
编程相关推荐