多CSV文件支持向量机的实现

2024-09-09 13:09:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道是否有可能有多个CSV文件用于培训,一个用于测试

例如,我得到了四个CSV文件,其中包含8列数据,一个用于标签,这与我的所有4个CSV培训文件不同

对于所有这些数据,我想在一个test.scv文件上进行测试,该文件只包含8列数据,并在同一个文件中添加预测标签。(不知道怎么做)

我设法做到这一点,只有一个CSV文件的测试和培训 代码如下:

svm_data = pd.read_csv('excel1.csv')


classifcator=svm_data[['alpha','beta','gama','teta','low_alpha','high_alpha','low_beta','high_beta']]

X=np.asarray(classifcator)

y=svm_data['label']

from sklearn.model_selection import train_test_split

# here not sure how to train_test_split with multiple csv files and one for training
X_train, X_test,y_train,y_test=train_test_split(X, y, test_size=0.2) 

from sklearn import preprocessing

X_train = preprocessing.scale(X_train)
X_test = preprocessing.scale(X_test)

classifier=SVC(kernel='linear')   

classifier.fit(X_train,y_train)


Y_predict = classifier.predict(X_test)


print(classification_report(y_test,Y_predict))

如果可能的话,我所需要的只是一个多个csv文件用于培训的示例。谢谢你抽出时间


Tags: 文件csv数据testalphadatatrain标签
1条回答
网友
1楼 · 发布于 2024-09-09 13:09:52

train_test_split用于将一组数据拆分为训练/测试数据-如果您已经用文件将其分开,则只需分别读取每个文件以创建训练/测试数据集,而不使用该功能

相关问题 更多 >