如何将变量名分配给csv文件中的各个行,并在python中访问这些行?

2024-09-25 00:22:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我的csv文件中有一个特定的数据,我用它作为训练数据来训练分类器。在python代码中,我将整个数据定义为x\u train变量中的一组行和y\u train中的标签。这是固定的。我是否可以这样更改代码:通过为每一行指定一个变量名(如第[0]行的变量“a”),如果在训练集中更改了数据,代码应自动更新为新数据并给出输出。你知道吗

代码是:

import sklearn
import numpy as np


#Importing a local data set from the desktop
import pandas as pd
mydata = pd.read_csv('apple.csv',skipinitialspace=True)
#print mydata

x_train = [[0,0,0],[0,1,0],[0,1,1],[1,1,1],[1,1,0]]
y_train = ['html','html','python','python','cpp']
x_test = ([[1,1,0]])

from sklearn import tree
classi = tree.DecisionTreeClassifier()
classi.fit(x_train, y_train)

predictions = classi.predict(x_test)
print predictions

培训数据为:

 x1,x2,x3,y
a 0,0,0,html
b 0,1,0,html
c 0,1,1,python
d 1,1,1,python
e 1,1,0,cpp

有人能帮我吗??你知道吗

更新: 当执行以下代码时

x_train = [[0,0,0],[0,1,0],[0,1,1],[1,1,1],[1,1,0]]
y_train = ['html','html','python','python','cpp']
x_test = ([[1,1,0]])

我得到的结果是

['cpp']

我想要的是:

x_train = [['a'],['b'],['c'],['d'],['e']]
y_train = ['html','html','python','python','cpp']
x_test = ([[1,1,0]])

输出应该保持不变! 怎么做!如果我尝试上面的代码,我会得到很多错误!!你知道吗


Tags: csv数据代码fromtestimporthtmlas