擅长:python、mysql、java
<p>理想情况下,您应保持测试数据完整-仅对列车数据进行抽样:
因此,删除行<code>X_test,y_test = oversample.fit_resample(X_test,y_test)</code></p>
<p>此外,您正在此处打印列车数据的分数:<code>print(np.mean(cross_val_score(classifier, X_train, y_train, cv=10)))</code>-当您尝试打印测试数据时会发生什么情况</p>
<p>另外,您可能应该将<code>min_samples_leaf</code>从1增加到一个更高的值-这里的1意味着您允许拆分,即使那里只有数据点-这肯定会帮助您进行过度拟合</p>