擅长:python、mysql、java
<p>今天我遇到了一个类似的问题,发现了两个可能对其他人有帮助的事情(这是一个回归问题,在一台有4个P100 gpu的机器上运行,行数约为2.1MM):</p>
<ol>
<li>在GPU机器上使用cudnlstm层而不是LSTM层,将拟合时间从每历元13500秒减少到400秒。在</li>
<li>增加批处理大小(~500到~4700)将其减少到每epoch约130秒。在</li>
</ol>
<p>减少批量大小会增加损失和val损失,因此您需要对您想要做出的权衡做出决定。在</p>