如何在非随机作战需求文件中分为训练、测试和简历

2024-05-10 14:42:59 发布

您现在位置：Python中文网/ 问答频道 /正文

1527

网友

男 | 程序猿一只，喜欢编程写python代码。

我知道以前可能有人问过这个问题，但我恐怕找不到答案。你知道吗

在Python中，如何将数据集按非重组顺序（时间顺序）拆分为训练集（70%）、测试集（15%）和交叉验证集（15%）？你知道吗

到目前为止，我已经累了

 `dx = pd.read_csv('eq_fut_test.csv', index_col=0, parse_dates=[0], 
 skiprows=0, header=0)                                                     
 dx = dx.fillna(method='pad')    
 X_train, X_validate, X_test = np.split(dx.sample(frac=1), [int(.7*len(dx)), 
 int(.8*len(dx))]) `

但是，数据集是随机分割的。你知道吗

任何关于这一点的说明都将不胜感激。非常感谢！你知道吗

Data file

Tags： csv 数据答案 test read index len 顺序

1条回答

网友

1楼 · 发布于 2024-05-10 14:42:59

你想学习训练测试分割函数here

from sklearn.model_selection import train_test_split

X_train, X_test_cross = train_test_split(dx.sample(frac=1), test_size=0.30, shuffle=False)
X_test, X_cross, = train_test_split(X_test_cross, test_size=0.5, shuffle=False)

第三行中的0.5是因为您拥有30%的数据，而30%中的50%会给您15%的数据。你知道吗

如何在非随机作战需求文件中分为训练、测试和简历

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在非随机作战需求文件中分为训练、测试和简历

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >