虹膜数据集机器学习分类模块

2024-10-03 02:32:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我有数据帧格式的训练数据集。以下仅为理解目的。在

培训资料设置:-在

 column Names = [SepalL,SepalW,PetalL,PetalW,Species]
 Training Data Set 1 = [5.1,3.5,1.4,0.2,Iris-setosa]
 Training Data Set 2 = [4.9,3.0,1.4,0.2,Iris-setosa]
 Training Data Set 3 = [4.7,3.2,1.3,0.2,Iris-veriscolor]
 Training Data Set 4 = [4.6,3.1,1.5,0.2,Iris-versicolor]
 Training Data Set 5 = [5.0,3.6,1.4,0.2,Iris-verginica]

当测试数据较少时,有没有办法根据测试数据考虑训练数据的列值编号列值与训练数据比较?在

^{pr2}$

Tags: 数据目的irisdatanames格式trainingcolumn
2条回答

我相信这会降低你模型的准确性。最好的方法是训练几个模型,每个模型缺少1到2列。或者,您可以尝试用here方法之一来填充一些缺失的值,但请注意,这不会给您提供您的模型在训练时使用相同格式的数据时最初获得的精度。在

kNN模型默认情况下不处理缺失值。在

如果您使用的是sklearn模型,那么在使用较少的功能时应该会看到一个失败,这表明功能的数量不匹配。这是因为模型的k质心是根据所有特征来确定的。对于你拥有的几个特征,也许所有的质心都是一样的。在

如果训练集中也有缺失的值,则可能需要选择另一种按构造处理缺失值的算法。在

相关问题 更多 >