擅长:python、mysql、java
<p>按以下步骤操作:</p>
<ol>
<li><p>通过分位数规范化来规范化数据,严格地说,在训练数据上而不是在整个数据集上计算这种转换。</p></li>
<li><p>通过增加辍学率或在权重中添加L1和L2惩罚来添加正则化。L1正则化类似于特征选择。</p></li>
<li><p>如果这些仍然没有帮助,那么减小网络的大小,以减少导致列车数据较少的网络参数。这并不总是最好的主意,因为它会损害性能。</p></li>
<li><p>最后,增加批量大小,有可能提高优化的稳定性。</p></li>
</ol>