sklearn kfold在python中返回错误的索引

2024-05-08 09:38:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用的是python中sklearn包中的kfold函数,该函数使用df(数据帧)和非连续行索引。在

代码如下:

kFold = KFold(n_splits=10, shuffle=True, random_state=None)
for train_index, test_index in kFold.split(dfNARemove):...

我得到了一些在我的数据表中不存在的训练索引或测试索引。在

我能做什么?在


Tags: 数据函数代码nonetruedfindexrandom
1条回答
网友
1楼 · 发布于 2024-05-08 09:38:18

kFold iterator为您提供了DataFrame的train和validation对象的位置索引,而不是它们的非连续索引。您可以使用.ilocpandas方法访问train和validation对象:

kFold = KFold(n_splits=10, shuffle=True, random_state=None)
for train_index, test_index in kFold.split(dfNARemove):
    train_data = dfNARemove.iloc[train_index]
    test_data = dfNARemove.iloc[test_index]

如果您想知道每个折叠上的列车索引和测试索引使用了哪些非连续索引,可以执行以下操作:

^{pr2}$

相关问题 更多 >

    热门问题