2024-05-08 09:38:18 发布
网友
我使用的是python中sklearn包中的kfold函数,该函数使用df(数据帧)和非连续行索引。在
代码如下:
kFold = KFold(n_splits=10, shuffle=True, random_state=None) for train_index, test_index in kFold.split(dfNARemove):...
我得到了一些在我的数据表中不存在的训练索引或测试索引。在
我能做什么?在
kFold iterator为您提供了DataFrame的train和validation对象的位置索引,而不是它们的非连续索引。您可以使用.ilocpandas方法访问train和validation对象:
.iloc
kFold = KFold(n_splits=10, shuffle=True, random_state=None) for train_index, test_index in kFold.split(dfNARemove): train_data = dfNARemove.iloc[train_index] test_data = dfNARemove.iloc[test_index]
如果您想知道每个折叠上的列车索引和测试索引使用了哪些非连续索引,可以执行以下操作:
kFold iterator为您提供了DataFrame的train和validation对象的位置索引,而不是它们的非连续索引。您可以使用
.iloc
pandas方法访问train和validation对象:如果您想知道每个折叠上的列车索引和测试索引使用了哪些非连续索引,可以执行以下操作:
^{pr2}$相关问题 更多 >
编程相关推荐