“样本数量不一致”scikit学习

2024-06-26 07:49:15 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在用Python（scikit-learn）学习机器学习的一些基础知识，当我试图实现K-最近邻算法时，出现了一个错误：ValueError:找到了样本数不一致的输入变量：[426143]。我不知道怎么处理它。
这是我的代码：

from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
cancer = load_breast_cancer()
X_train, y_train, X_test, y_test = train_test_split(cancer.data,cancer.target, 
                                                    stratify = 
                                                    cancer.target,
                                                    random_state = 0)
clf = KNeighborsClassifier(n_neighbors = 6)
clf.fit(X_train, y_train)`

Tags： from test import target load neighbors train sklearn

1条回答

网友

1楼 · 发布于 2024-06-26 07:49:15

train_test_split按X_train, X_test, y_train, y_test的顺序返回一个元组

您为错误的变量指定了返回值，因此您使用的是训练数据和测试数据，而不是训练数据和训练标签。在

应该是的

X_train, X_test, y_train, y_test = train_test_split()

“样本数量不一致”scikit学习

相关问题更多 >

编程相关推荐

热门问题

热门文章

“样本数量不一致”scikit学习

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >