如何将数据随机分为训练集和测试集？

fid=fopen(datafile); C = textscan(fid, '%s','delimiter', '\n'); plist=randperm(100); for i=1:50 trainstring = C{plist(i)}; fprintf(train_file,trainstring); end for i=51:100 teststring = C{plist(i)}; fprintf(test_file,teststring); end

3条回答

网友

1楼 · 编辑于 2024-05-02 01:11:46

在Python中，这可以类似地使用列表来实现（注意，整个列表都在适当的位置进行了洗牌）。

import random

with open("datafile.txt", "rb") as f:
    data = f.read().split('\n')

random.shuffle(data)

train_data = data[:50]
test_data = data[50:]

网友

2楼 · 编辑于 2024-05-02 01:11:46

你也可以用numpy。当数据存储在numpy.ndarray中时：

import numpy as np
from random import sample
l = 100 #length of data 
f = 50  #number of elements you need
indices = sample(range(l),f)

train_data = data[indices]
test_data = np.delete(data,indices)

网友

3楼 · 编辑于 2024-05-02 01:11:46

from sklearn.model_selection import train_test_split
import numpy

with open("datafile.txt", "rb") as f:
   data = f.read().split('\n')
   data = numpy.array(data)  #convert array to numpy type array

   x_train ,x_test = train_test_split(data,test_size=0.5)       #test_size=0.5(whole_data)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将数据随机分为训练集和测试集？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >