文件上分离的数据集的交叉验证

1条回答

网友

1楼 · 发布于 2024-09-26 17:59:58

看看this answer，我意识到pandas可以连接数据帧。我检查了这个过程比cat命令行慢了15-20%，但是可以像我预期的那样进行折叠。在

不管怎样，我很确定应该有比这更好的方法：

import glob
import numpy as np
import pandas as pd
from sklearn.cross_validation import KFold

allFiles = glob.glob("./dataset/*.txt")
kf = KFold(len(allFiles), n_folds=3, shuffle=True)

for train_files, cv_files in kf:
    dataTrain = pd.concat((pd.read_csv(allFiles[idTrain], header=None) for idTrain in train_files))
    dataTest = pd.concat((pd.read_csv(allFiles[idTest], header=None) for idTest in cv_files))

编程相关推荐

java如何拆分字符串（基于各种分隔符），但不保留空格？
解析。Json格式的txt文件和knime中的java
java Spring rest api为什么在rest api调用的响应中更改了数据类型
升华文本3抛出java。lang.ClassNotFoundException，而记事本++不存在
java Android指纹扫描仪在尝试5次后停止工作？
java Android如何设置精确的重复报警？
java如何使用HTTPGET connect为access API输入用户名和密码
java当测试报告显示没有测试失败时，Gradle为什么说“有失败的测试”？
用Gson实现java获取响应
MapReduce程序中函数错误的java不可映射参数

相关问题更多 >

编程相关推荐

热门问题

热门文章

文件上分离的数据集的交叉验证

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >