weka数据挖掘库的python包装器。
pywekaclassifiers的Python项目详细描述
用于Weka分类器的Weka-Python包装器
概述
提供一个方便的包装器,用于从Python调用Weka分类器
安装
首先安装weka和libsvm java库。在Debian/Ubuntu上,这只是:
sudo apt-get install weka libsvm-java
然后使用pip安装python包:
sudo pip install pywekaclassifiers
用法
通过实例化分类器类来训练和测试Weka分类器, 传入要使用的分类器的名称:
from pywekaclassifiers.classifiers import Classifier
c = Classifier(name='weka.classifiers.lazy.IBk', ckargs={'-K':1})
c.train('training.arff')
predictions = c.predict('query.arff')
或者,可以通过直接调用其名称来实例化分类器:
from pywekaclassifiers.classifiers import IBk
c = IBk(K=1)
c.train('training.arff')
predictions = c.predict('query.arff')
这个实例包含了weka的序列化模型,因此分类器可以很容易地 pickled和unpickle与任何普通的Python实例一样:
c.save('myclassifier.pkl')
c = Classifier.load('myclassifier.pkl')
predictions = c.predict('query.arff')
开发
测试需要安装Python开发头文件,您可以使用以下命令在Ubuntu上安装:
sudo apt-get install python-dev python3-dev python3.4-dev
要跨多个python版本运行unittests,请安装:
sudo apt-get install python3.4-minimal python3.4-dev python3.5-minimal python3.5-dev
运行所有tests:
export TESTNAME=; tox
为特定环境(如Python2.7)运行测试:
export TESTNAME=; tox -e py27
运行特定测试:
export TESTNAME=.test_IBk; tox -e py27