我试图解析这个文件http://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt来运行多功能回归,但是我得到了一个“ValueError:foundarray with dim3”。估计值应为<;=2。“。顺便问一下,输入必须是浮点型的吗?在
database = open(r'diabetes.rwrite1.txt','r').readlines()[1:]
lstx = []
lsty = []
for line in database:
splitted = line.split()
lstx.append(splitted[0:9])
lsty.append(float(splitted[10]))
x_ = np.array(lstx)[:, np.newaxis, 1:9]
x = x_.astype(float)
y = np.array(lsty)
lr = LinearRegression()
lr.fit(x, y)
如果你想预测一个连续变量,那么使用LinearRegression。如果要预测类别,则需要使用logisticRetirection或RandomForestClassifier等分类器。在
在sklearn中,这些几乎总是在名称中有“分类器”。在
相关问题 更多 >
编程相关推荐