擅长:python、mysql、java
<p>我不是专家,但首先我建议您相信交叉验证结果。
交叉验证将数据分为N个部分,每次使用N-1进行训练,1进行测试,因此其结果显示更真实的结果。
我还建议您重新整理数据并计算评估的置信区间</p>
<p>95%置信区间可计算为:</p>
<pre class="lang-py prettyprint-override"><code>aux = 1.96 * sqrt((evaluation*(1-evaluation))/num_test_samples)
</code></pre>
<p>使用交叉验证评估及其相应的置信区间,请记住,如果我没有错的话,也可以在cross_validate()方法中获得列车评估</p>
<p>这三件事你们可以看到列车评估和测试评估有多大的变化。
如果你的训练评估比你的测试评估大很多,你可能有过拟合</p>
<p>当您的训练结果与测试评估相比非常大,并且训练精度趋向于100%时,您知道您的模型不能很好地推广。
特别是在神经网络中,很容易通过历元传递看到</p>