擅长:python、mysql、java
<p>以下是我的建议</p>
<ol>
<li><p>移除所有防止过度装配的东西,例如脱落和正则化器。可能发生的情况是,您的模型可能无法使用给定的层捕获数据的复杂性,因此在添加正则化器之前,您需要确保您的模型能够首先进行过度拟合</p></li>
<li><p>现在试着增加致密层的数量和每层神经元的数量,直到你们能看到一些改善。还有一种可能是您的数据太过嘈杂,或者您只有很少的数据来训练模型,因此您甚至无法生成有用的预测</p></li>
<li><p>现在,如果您是<strong>幸运的</strong>,并且您可以看到过度拟合,您可以添加Dropout和regularizer</p></li>
</ol>
<p>因为每个神经网络都是基于梯度的算法,所以最终可能会达到局部最小值。您可能还需要使用不同的初始权重多次运行该算法,然后才能获得好的结果,或者您可以更改损失函数,这样您就有了一个凸问题,其中局部最小值是全局最小值</p>
<p><strong>如果你不能取得更好的结果</strong></p>
<p>您可能需要尝试不同的拓扑,因为LSTM只是尝试对假定具有马尔可夫特性的系统建模。您可以查看嵌套的LSTM或类似的东西,它以一种方式对系统进行建模,即下一时间步不仅仅依赖于当前时间步</p>