有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何将数据集划分为训练集和测试集?

我尝试使用朴素贝叶斯分类算法和map-reduce框架对数据集进行分类。 我的问题是,如何将数据集划分为训练集和测试集,以计算更正和错误的ed分类实例的准确性


共 (1) 个答案

  1. # 1 楼答案

    您可以使用RemovePercentage过滤器 训练集: 1.加载完整的数据集 2.在预处理面板中选择RemovePercentage过滤器 3.为拆分设置正确的百分比 4.使用过滤器 5.将生成的数据另存为新文件

    测试集: 1.加载完整数据集(或仅使用“撤消”将更改还原到数据集) 2.如果尚未选择,请选择RemovePercentage过滤器 3.将invertSelection属性设置为true 4.使用过滤器 5.将生成的数据另存为新文件