擅长:python、mysql、java
<p>根据@lejlot的注释,我锁定案例数量的方法是在sklearn0.17上使用<a href="http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.train_test_split.html" rel="nofollow">^{<cd1>}</a>的新特性。现在有一个名为<strong>分层</strong>的参数,我使用如下方式(这将强制拆分遵循标签列表中标签的数量):</p>
<pre><code>[trnImgs, testImgs, trnTargets, testTargets] = \
train_test_split(trnImgPaths, trnImgTargets, test_size=0.7,
train_size=0.3, stratify=trnImgTargets)
</code></pre>
<p>现在,每次我运行脚本时都会得到:</p>
^{pr2}$