我知道以前可能有人问过这个问题,但我恐怕找不到答案。你知道吗
在Python中,如何将数据集按非重组顺序(时间顺序)拆分为训练集(70%)、测试集(15%)和交叉验证集(15%)?你知道吗
到目前为止,我已经累了
`dx = pd.read_csv('eq_fut_test.csv', index_col=0, parse_dates=[0],
skiprows=0, header=0)
dx = dx.fillna(method='pad')
X_train, X_validate, X_test = np.split(dx.sample(frac=1), [int(.7*len(dx)),
int(.8*len(dx))]) `
但是,数据集是随机分割的。你知道吗
任何关于这一点的说明都将不胜感激。非常感谢!你知道吗
你想学习训练测试分割函数here
第三行中的
0.5
是因为您拥有30%的数据,而30%中的50%会给您15%的数据。你知道吗相关问题 更多 >
编程相关推荐