当使用pythonwekawraper运行weka时，如何设置测试选项？

import weka.core.jvm as jvm from weka.core.converters import Loader from weka.classifiers import Classifier,Evaluation from random import randint jvm.start() url = 'C:/Data/train_dataset.csv' loader = Loader(classname = 'weka.core.converters.CSVLoader') data = loader.load_file(url) data.class_is_last() seed = randint(1,99e6) optimizations = 15 options = f'-F 3 -N 2.0 -O {optimizations} -S {seed}'.split() jrip = Classifier(classname = 'weka.classifiers.rules.JRip',options=options) jrip.build_classifier(data) ruleset = jrip.jwrapper.getRuleset() for i in range(ruleset.size()): rule = ruleset.get(i) print(rule.toString(data.class_attribute.jobject))

1条回答

网友

1楼 · 发布于 2024-09-30 00:35:39

评价

在代码示例中，您在完整数据集上训练了分类器（JRip），没有执行交叉验证或任何其他形式的评估。weka.classifiers.EvaluationPython类用于评估模型

example repository包含以下示例：

cross-validation（文件：Evaluation.crossvalidate_model）
train/test splits （文件：Evaluation.test_model，便利方法：Evaluation.evaluate_train_test_split）

只有test_model需要经过训练的分类器（当您根据测试集评估其预测时）。crossvalidate_model和evaluate_train_test_split方法应该只接收配置的分类器对象，而不是经过训练的分类器

期权处理

如果您想知道分类器设置了哪些选项，只需通过options属性检索选项列表。如果要更改它们，请通过为同一属性提供列表来设置它们

c = Classifier(...)
# print current options
print(c.options)
# set new options
c.options = ['-SOME', 'NEW', 'OPTIONS']

或者，您可以调用Classifier的to_commandline()方法，以获得与Weka在Weka Explorer中复制时提供的相同的命令行字符串（Weka中的大多数类，如过滤器、分类器和集群，都是选项处理程序，即它们具有此方法）

由于Weka的选项处理有点不同（嵌套是通过双引号完成的，内部嵌套是通过反斜杠转义引号完成的），因此应该使用weka.core.classes模块中的方法split_options将命令行字符串（带或不带类名）拆分为值列表

或者，您可以使用weka.core.classes模块的from_commandline()方法，而不是手动拆分命令行字符串，该方法允许您将包含classname和option的单个字符串拆分为Weka对象。例如：

from weka.core.classes import from_commandline
cmdline = 'weka.classifiers.functions.SMO -K "weka.classifiers.functions.supportVector.NormalizedPolyKernel -E 3.0"'
classifier = from_commandline(cmdline, classname="weka.classifiers.Classifier")

评价

期权处理

相关问题更多 >

编程相关推荐

热门问题

热门文章