Keras培训陷入LSTM

2024-09-28 03:12:35 发布

男 | 程序猿一只，喜欢编程写python代码。

我试着在Keras运行一个LSTM模型，但在训练部分被卡住了。在

对于每一个历元，模型需要3-4秒来训练步长到49x/500，然后模型就会卡住。大约7xx秒后，训练将恢复，完成剩下的几步，完成一个新纪元。在

然后它再次循环，列车非常快，然后冻结。在

可能的原因是什么？在

我运行的代码是francoischollet的《用Python进行深度学习》一书中的编码示例p.213。如果代码/我的硬件有问题，每个历元的训练过程应该总是缓慢的？现在它在开始时训练得很快，但在每一个纪元结束时都会卡住。

我尝试过更新GPU驱动程序，conda更新——全部，分配另一个GPU来运行模型（我有2个GPU）。在

我确信我的GPU是好的，因为我运行其他模型没有问题。在

Tags：代码模型示例编码硬件 gpu 过程原因

1条回答

网友

1楼 · 发布于 2024-09-28 03:12:35

这是正常的，在每个纪元结束时，Keras会使用你的验证数据来计算验证损失和度量，这当然需要时间，也许你的验证集比你的训练集还要大？在

它看起来像是冻结了，但它确实在验证集上进行计算，无需担心。在