为什么10倍交叉验证的准确度得分比使用sklearn进行的9010系列测试分割的准确度得分最差？问题的回答

为什么10倍交叉验证的准确度得分比使用sklearn进行的9010系列测试分割的准确度得分最差？

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

任务是通过神经网络进行二元分类。数据存在于字典中，其中包含每个条目的复合名称（作为键）和标签（0或1，作为向量值中的第三个元素）。第一个和第二个元素是组合名称的两部分，稍后用于提取相应的特征 在这两种情况下，字典被转换为两个数组，以便对多数类（66%的数据中存在）执行平衡欠采样： <pre><code>data_for_sampling = np.asarray([key for key in list(data.keys())]) labels_for_sampling = [element[2] for element in list(data.values())] sampler = RandomUnderSampler(sampling_strategy = 'majority') data_sampled, label_sampled = sampler.fit_resample(data_for_sampling.reshape(-1, 1), labels_for_sampling) </code></pre> 然后使用重新采样的名称和标签数组，通过Kfold方法创建训练集和测试集： <pre><code>kfolder = KFold(n_splits = 10, shuffle = True) kfolder.get_n_splits(data_sampled) for train_index, test_index in kfolder.split(data_sampled): data_train, data_test = data_sampled[train_index], data_sampled[test_index] </code></pre> 或列车试验分割法： <pre><code>data_train, data_test, label_train, label_test = train_test_split(data_sampled, label_sampled, test_size = 0.1, shuffle = True) </code></pre> 最后，使用data_train和data_test中的名称从原始词典中重新提取相关条目（按键），然后使用这些条目收集这些条目的特征。就我而言，10个折叠集的单个拆分应提供与90-10个train_test_拆分类似的列车测试数据分布，这似乎在训练期间是正确的，其中两个训练集仅在一个历元后产生约0.82的精度，分别使用model.fit（）运行。但是，当使用model.evaluate（）对上述历元之后的测试集评估相应的模型时，train_test_split中的集给出~0.86分，而Kfold中的集给出~0.72分。我做了很多测试，看看它是否只是一个坏的随机种子，它是没有边界的，但结果保持不变。这些集合还具有正确平衡的标签分布和看似混乱的条目

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

为什么10倍交叉验证的准确度得分比使用sklearn进行的9010系列测试分割的准确度得分最差？

1 个回答

相关Python问题