在使用Keras培训CNNLSTM时卡在第一个时代

def conv2d_lstm_with_author(): # Get the input information - author & tweet author_repre_input = Input(shape=(100,), name='author_input') tweet_input = Input(shape=(13, 100, 1), name='tweet_input') # Create the convolutional layer and lstm layer conv2d = Conv2D(filters = 200, kernel_size = (2, 100), padding='same', activation='relu', use_bias=True, name='conv_1')(tweet_input) flat = Flatten(name='flatten_1')(conv2d) reshape_flat = Reshape((260000, 1), name='reshape_1')(flat) lstm = LSTM(100, return_state=False, activation='tanh', recurrent_activation='hard_sigmoid', name='lstm_1')(reshape_flat) concatenate_layer = concatenate([lstm, author_repre_input], axis=1, name='concat_1') dense_1 = Dense(10, activation='relu', name='dense_1')(concatenate_layer) output = Dense(3, activation='softmax', kernel_regularizer=regularizers.l2(0.01), name='output_dense')(dense_1) # Build the model model = Model(inputs=[author_repre_input, tweet_input], outputs=output) return model model = conv2d_lstm_with_author() model.summary() optimizer = Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.0) model.compile(optimizer=optimizer, loss='categorical_crossentropy', metrics=['accuracy'])

2条回答

网友

1楼 · 编辑于 2024-09-28 21:59:00

幸运的是，你没有陷入困境

这个问题来自这样一个事实：在model.fit中，您指定了参数verbose=2

这意味着您的代码只会在一个时代结束时输出消息，而不会在培训过程中输出信息性消息

要解决您的问题并查看培训进度，请设置verbose=1

网友

2楼 · 编辑于 2024-09-28 21:59:00

我想我已经找到了答案

问题在于卷积层。内核大小太小，导致输出层的维数太高。为了解决这个问题，我将内核大小从(2, 100)更改为(3, 100)。此外，我还向我的模型中添加了辍学者。我现在使用的模型总结如下：

现在，该模型可以在Google Colab中顺利运行

因此，我认为如果出现类似问题，请检查每层的输出尺寸。如果模型产生非常高的维输出，则Keras API可能会在训练阶段停止

相关问题更多 >

编程相关推荐

热门问题

热门文章