我正在用Python(scikit-learn)学习机器学习的一些基础知识,当我试图实现K-最近邻算法时,出现了一个错误:ValueError:找到了样本数不一致的输入变量:[426143]。我不知道怎么处理它。
这是我的代码:
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
cancer = load_breast_cancer()
X_train, y_train, X_test, y_test = train_test_split(cancer.data,cancer.target,
stratify =
cancer.target,
random_state = 0)
clf = KNeighborsClassifier(n_neighbors = 6)
clf.fit(X_train, y_train)`
train_test_split
按X_train, X_test, y_train, y_test
的顺序返回一个元组您为错误的变量指定了返回值,因此您使用的是训练数据和测试数据,而不是训练数据和训练标签。在
应该是的
相关问题 更多 >
编程相关推荐