我试着在Keras运行一个LSTM模型,但在训练部分被卡住了。在
对于每一个历元,模型需要3-4秒来训练步长到49x/500,然后模型就会卡住。大约7xx秒后,训练将恢复,完成剩下的几步,完成一个新纪元。在
然后它再次循环,列车非常快,然后冻结。在
可能的原因是什么?在
我运行的代码是francoischollet的《用Python进行深度学习》一书中的编码示例p.213。如果代码/我的硬件有问题,每个历元的训练过程应该总是缓慢的?现在它在开始时训练得很快,但在每一个纪元结束时都会卡住。
我尝试过更新GPU驱动程序,conda更新——全部,分配另一个GPU来运行模型(我有2个GPU)。在
我确信我的GPU是好的,因为我运行其他模型没有问题。在
这是正常的,在每个纪元结束时,Keras会使用你的验证数据来计算验证损失和度量,这当然需要时间,也许你的验证集比你的训练集还要大?在
它看起来像是冻结了,但它确实在验证集上进行计算,无需担心。在
相关问题 更多 >
编程相关推荐