需要代码:使用6种不同的高斯分类器对虹膜数据进行分类

2024-09-27 21:25:32 发布

您现在位置:Python中文网/ 问答频道 /正文

1交叉验证数据设计 Iris数据集由150个4维向量样本和1个整数标签组成。有3个 不同的标签,每个标签正好有50个样本。我们首先要做5倍交叉验证 如下所示:

  1. 对于类别1,将数据拆分为5个折叠:样本编号1-10、11-20、21-30、31-40和41-50,它们分别命名为f11、f12、f13、f14和f15

  2. 对于2类,其褶皱为f21、f22、f23、f24和f25

  3. 对于3类,其褶皱为f31、f32、f33、f34和f35

  4. 通过R1={f11,…,创建一个训练数据集。,f14,f21。,24层,31层。,f34},测试集T1={f15,f25,f35}

  5. 用R1训练上述6个高斯分类器,在T1上计算精度

  6. 用R2-R5和T2-T5重复上述步骤,以获得5个精度

  7. 求平均精度,确定虹膜数据集的最佳高斯分类器

2支持向量机 支持向量机的超参数是C(non-separability)和核特定参数。使用5倍交叉 验证到

  1. 确定多项式核函数的最佳C和次(阶、秩等)
  2. 确定最佳C和标准差的高斯核函数(或称为

RBF核参数)。 这些超参数的选择过程称为网格搜索,因为离散参数的组合- 我们在多维向量空间中建立了一个网格,我们在每个网格中寻找 最优超参数集。 关键的设计问题是离散连续参数空间的选择:例如 通常选择C={1,10,100,…}


Tags: 数据网格参数标签向量交叉样本f11

热门问题