我需要对存储在pandas.DataFrame中的数据集执行n倍(在我的特殊情况下,是5倍)交叉验证。我目前的方式似乎是重新排列行标签
spreadsheet1 = pd.ExcelFile("Testing dataset.xlsx")
dataset = spreadsheet1.parse('Sheet1')
data = 5 * [pd.DataFrame()]
i = 0
while(i < len(dataset)):
j = 0
while(j < 5 and i < len(dataset)):
data[j] = (data[j].append(dataset.iloc[i])).reset_index(drop = True)
i += 1
j += 1
如何高效/智能地分割数据帧而不改变列的顺序
使用
np.array_split
将其分解为“均匀”大小的数据帧列表。如果对完整的数据帧进行采样,也可以进行洗牌我仍然不知道你为什么要这样做,但这里有一个解决办法
例如,您的第一次折叠是
相关问题 更多 >
编程相关推荐