我的csv文件中有一个特定的数据,我用它作为训练数据来训练分类器。在python代码中,我将整个数据定义为x\u train变量中的一组行和y\u train中的标签。这是固定的。我是否可以这样更改代码:通过为每一行指定一个变量名(如第[0]行的变量“a”),如果在训练集中更改了数据,代码应自动更新为新数据并给出输出。你知道吗
代码是:
import sklearn
import numpy as np
#Importing a local data set from the desktop
import pandas as pd
mydata = pd.read_csv('apple.csv',skipinitialspace=True)
#print mydata
x_train = [[0,0,0],[0,1,0],[0,1,1],[1,1,1],[1,1,0]]
y_train = ['html','html','python','python','cpp']
x_test = ([[1,1,0]])
from sklearn import tree
classi = tree.DecisionTreeClassifier()
classi.fit(x_train, y_train)
predictions = classi.predict(x_test)
print predictions
培训数据为:
x1,x2,x3,y
a 0,0,0,html
b 0,1,0,html
c 0,1,1,python
d 1,1,1,python
e 1,1,0,cpp
有人能帮我吗??你知道吗
更新: 当执行以下代码时
x_train = [[0,0,0],[0,1,0],[0,1,1],[1,1,1],[1,1,0]]
y_train = ['html','html','python','python','cpp']
x_test = ([[1,1,0]])
我得到的结果是
['cpp']
我想要的是:
x_train = [['a'],['b'],['c'],['d'],['e']]
y_train = ['html','html','python','python','cpp']
x_test = ([[1,1,0]])
输出应该保持不变! 怎么做!如果我尝试上面的代码,我会得到很多错误!!你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐