擅长:python、mysql、java
<p>我想这里可能会发生一些事情。</p>
<p>首先,我建议使用与您使用的不同的层激活配置。特别是,对于初学者,尝试对网络中的隐藏层使用sigmoidal非线性,并对输出层使用线性激活。这是一个典型的监控网络的最常见的设置,应该可以帮助您开始。</p>
<p>我注意到的第二件事是,您的培训师中的<code>weightDecay</code>参数有一个相对较大的值(尽管什么构成“相对较大”取决于您的输入和输出值的自然比例)。对于初学者,我将删除该参数,或者将其值设置为0。权重衰减是一个正则化器,它有助于防止网络过度拟合,但如果您将该参数的值增加过多,则网络权重将很快全部变为0(然后网络的梯度基本上为0,因此学习将停止)。只有在培训期间验证数据集的性能开始下降时,才将<code>weightDecay</code>设置为非零值。</p>