用于集成学习的堆栈库

stacking的Python项目详细描述


用于堆栈的库(堆栈一般化)
==
==




在数据/输入下设置列车和测试数据集。

2.从原始数据集创建的特征需要在
数据/输出/特征下。堆叠模型在脚本文件夹下的脚本中定义。

4.需要在脚本中定义已创建的功能。

5.只需运行``sh run.sh``(``python scripts/xxx.py```)

----




Getting Started:30秒到stacking
-

-
-



installation



sudo python setup.py install


您还可以从pypi安装堆栈:


::


——
——
——
——
——
——
——基本固定的折叠。py(堆栈类)
——数据/
——输入/

————test.csv(test数据集)

-output/

-features/
-features.csv(用户创建的功能)
-temp/
-temp.csv(在堆栈中保存的文件)

-scripts/
-script.csv(定义具体模型的主脚本)

-


-这里定义了叠加的基本模型(使用
sklearn.base.baseestimator)。
-这里定义了一些模型。例如,XGBoost、Keras、Vowpal Wabbit。
这些模型被包装为SCIKIT学习(使用< BR/SkLyn.BaseCuffiMyIn,SkPood.Base.ReasReSuxMin)。和
predict()。


可以在此处添加新的用户定义模型。


>基本模型有一些参数。

-'s':叠加。保存一个oof(out-of-fold)
预测({model\u name}u all\u fold.csv)和基于火车折叠模型的平均测试预测({model\u name}u test.csv)。这些
文件将用于下一级堆栈。

-'t':使用所有数据进行训练并预测
测试({model\\u name}\u testinallingdata.csv)。在本培训中,不使用验证数据。


-'s t':堆叠,然后使用所有数据和预测测试(“s”
和“t”)进行培训。

-'cv':仅交叉验证而不保存预测。

在脚本顶部定义task
详细信息。列车和试验特性集在此定义。需要定义cv折叠索引。

可以定义任何级别的堆叠。

-
-


todo list
-


需要更通用的库。

请检查isuues!!

…| pypi版本图像::https://badge.fury.io/py/stacking.svg
:目标:https://badge.fury.io/py/stacking
…|许可证图像::https://img.shields.io/github/license/mashape/apistatus.svg?maxage=2592000
:目标:https://github.com/ikki407/stacking/license

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何使用“Wed,01 Jul 2015 17:32:41 EDT”解析字符串   java Storm apache升级(1.0.0到2.0.0)   java类驻留在不同的目录中,而不是包指定的目录。为什么?   将Java中的图像缩放到非常小的维度   java如何通过子文档从自定义方面访问ElasticSearch parentdoc字段   java如何在RationalSoftwareArchitect中使用findbugs?   Java中的事件提升处理   java值被添加到arrayList的所有索引中,而不是在“”时添加到最后一个索引中。正在使用arraylist的add()方法   JFrame中的java JPanel派生类   java如何用循环和异步方法模拟类   java Android阻止可绘制背景超出视图范围   为客户排序Java阵列   java Apache poi如何将工作表设置为枚举位置值属性?   java Rhino在使用自定义类参数调用javascript函数时出错   java格式化日期从年月日到年月日   spring如何修复java。lang.illegalargumentexception在此特定场景中是否尝试创建具有null实体的合并事件?   java如何创建更好的对象