java如何将数据集划分为训练集和测试集? 3 月,1 周 Questions & Answers 355 我尝试使用朴素贝叶斯分类算法和map-reduce框架对数据集进行分类。 我的问题是,如何将数据集划分为训练集和测试集,以计算更正和错误的ed分类实例的准确性
# 1 楼答案 您可以使用RemovePercentage过滤器 训练集: 1.加载完整的数据集 2.在预处理面板中选择RemovePercentage过滤器 3.为拆分设置正确的百分比 4.使用过滤器 5.将生成的数据另存为新文件 测试集: 1.加载完整数据集(或仅使用“撤消”将更改还原到数据集) 2.如果尚未选择,请选择RemovePercentage过滤器 3.将invertSelection属性设置为true 4.使用过滤器 5.将生成的数据另存为新文件
# 1 楼答案
您可以使用
RemovePercentage
过滤器 训练集: 1.加载完整的数据集 2.在预处理面板中选择RemovePercentage过滤器 3.为拆分设置正确的百分比 4.使用过滤器 5.将生成的数据另存为新文件测试集: 1.加载完整数据集(或仅使用“撤消”将更改还原到数据集) 2.如果尚未选择,请选择RemovePercentage过滤器 3.将invertSelection属性设置为true 4.使用过滤器 5.将生成的数据另存为新文件