StratifiedKFold:索引器错误：数组的索引太多

2024-06-26 12:47:03 发布

您现在位置：Python中文网/ 问答频道 /正文

398

网友

男 | 程序猿一只，喜欢编程写python代码。

使用sklearn的StratifiedKFold函数，有人能帮助我理解这里的错误吗？

我的猜测是，这与我的标签输入数组有关，我注意到当我打印它们（本例中的前16个）时，索引从0变为15，但在超出我预期的情况下，额外的0被打印出来。也许我只是个Python迷，但那看起来很奇怪。

有人看见上面的傻瓜吗？

文档：http://scikit-learn.org...StratifiedKFold.html

代码：

import nltk
import sklearn

print('The nltk version is {}.'.format(nltk.__version__))
print('The scikit-learn version is {}.'.format(sklearn.__version__))

print type(skew_gendata_targets.values), skew_gendata_targets.values.shape
print skew_gendata_targets.head(16)

skew_sfold10 = cross_validation.StratifiedKFold(skew_gendata_targets.values, n_folds=10, shuffle=True, random_state=20160121)

结果

The nltk version is 3.1.
The scikit-learn version is 0.17.
<type 'numpy.ndarray'> (500L, 1L)
    0
0   0
1   0
2   0
3   0
4   0
5   0
6   0
7   0
8   0
9   0
10  0
11  0
12  0
13  0
14  1
15  0
---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-373-653b6010b806> in <module>()
      8 print skew_gendata_targets.head(16)
      9 
---> 10 skew_sfold10 = cross_validation.StratifiedKFold(skew_gendata_targets.values, n_folds=10, shuffle=True, random_state=20160121)
     11 
     12 #print '\nSkewed Generated dataset (', len(skew_gendata_data), ')'

d:\Program Files\Anaconda2\lib\site-packages\sklearn\cross_validation.pyc in __init__(self, y, n_folds, shuffle, random_state)
    531         for test_fold_idx, per_label_splits in enumerate(zip(*per_label_cvs)):
    532             for label, (_, test_split) in zip(unique_labels, per_label_splits):
--> 533                 label_test_folds = test_folds[y == label]
    534                 # the test split can be too big because we used
    535                 # KFold(max(c, self.n_folds), self.n_folds) instead of

IndexError: too many indices for array

Tags： the in test is version sklearn label values

1条回答

网友

1楼 · 发布于 2024-06-26 12:47:03

检查skew_gendata_targets.values的形状。你会发现它并不像StratifiedKFold所期望的那样是一个一维数组（形状为500，1），而是一个（500，1）数组。SKlearn将这些区别对待，而不是强迫它们相同。如果有帮助请告诉我

StratifiedKFold:索引器错误：数组的索引太多

相关问题更多 >

编程相关推荐

热门问题

热门文章

StratifiedKFold:索引器错误：数组的索引太多

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >