如何在非随机作战需求文件中分为训练、测试和简历

2024-05-10 14:42:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我知道以前可能有人问过这个问题,但我恐怕找不到答案。你知道吗

在Python中,如何将数据集按非重组顺序(时间顺序)拆分为训练集(70%)、测试集(15%)和交叉验证集(15%)?你知道吗

到目前为止,我已经累了

 `dx = pd.read_csv('eq_fut_test.csv', index_col=0, parse_dates=[0], 
 skiprows=0, header=0)                                                     
 dx = dx.fillna(method='pad')    
 X_train, X_validate, X_test = np.split(dx.sample(frac=1), [int(.7*len(dx)), 
 int(.8*len(dx))]) `   

但是,数据集是随机分割的。你知道吗

任何关于这一点的说明都将不胜感激。非常感谢!你知道吗

Data file


Tags: csv数据答案testreadindexlen顺序
1条回答
网友
1楼 · 发布于 2024-05-10 14:42:59

你想学习训练测试分割函数here

from sklearn.model_selection import train_test_split

X_train, X_test_cross = train_test_split(dx.sample(frac=1), test_size=0.30, shuffle=False)
X_test, X_cross, = train_test_split(X_test_cross, test_size=0.5, shuffle=False)

第三行中的0.5是因为您拥有30%的数据,而30%中的50%会给您15%的数据。你知道吗

相关问题 更多 >