用于集成学习的堆栈库
stacking的Python项目详细描述
用于堆栈的库(堆栈一般化)
==
==
在数据/输入下设置列车和测试数据集。
2.从原始数据集创建的特征需要在
数据/输出/特征下。堆叠模型在脚本文件夹下的脚本中定义。
4.需要在脚本中定义已创建的功能。
5.只需运行``sh run.sh``(``python scripts/xxx.py```)
----
Getting Started:30秒到stacking
-
-
-
installation
sudo python setup.py install
您还可以从pypi安装堆栈:
::
——
——
——
——
——
——
——基本固定的折叠。py(堆栈类)
——数据/
——输入/
—— ——test.csv(test数据集)
-output/
-features/
-features.csv(用户创建的功能)
-temp/
-temp.csv(在堆栈中保存的文件)
-scripts/
-script.csv(定义具体模型的主脚本)
-
-这里定义了叠加的基本模型(使用
sklearn.base.baseestimator)。
-这里定义了一些模型。例如,XGBoost、Keras、Vowpal Wabbit。
这些模型被包装为SCIKIT学习(使用< BR/SkLyn.BaseCuffiMyIn,SkPood.Base.ReasReSuxMin)。和
predict()。
可以在此处添加新的用户定义模型。
>基本模型有一些参数。
-'s':叠加。保存一个oof(out-of-fold)
预测({model\u name}u all\u fold.csv)和基于火车折叠模型的平均测试预测({model\u name}u test.csv)。这些
文件将用于下一级堆栈。
-'t':使用所有数据进行训练并预测
测试({model\\u name}\u testinallingdata.csv)。在本培训中,不使用验证数据。
-'s t':堆叠,然后使用所有数据和预测测试(“s”
和“t”)进行培训。
-'cv':仅交叉验证而不保存预测。
在脚本顶部定义task
详细信息。列车和试验特性集在此定义。需要定义cv折叠索引。
可以定义任何级别的堆叠。
-
-
todo list
-
需要更通用的库。
请检查isuues!!
…| pypi版本图像::https://badge.fury.io/py/stacking.svg
:目标:https://badge.fury.io/py/stacking
…|许可证图像::https://img.shields.io/github/license/mashape/apistatus.svg?maxage=2592000
:目标:https://github.com/ikki407/stacking/license
==
==
在数据/输入下设置列车和测试数据集。
2.从原始数据集创建的特征需要在
数据/输出/特征下。堆叠模型在脚本文件夹下的脚本中定义。
4.需要在脚本中定义已创建的功能。
5.只需运行``sh run.sh``(``python scripts/xxx.py```)
----
Getting Started:30秒到stacking
-
-
-
installation
sudo python setup.py install
您还可以从pypi安装堆栈:
::
——
——
——
——
——
——
——基本固定的折叠。py(堆栈类)
——数据/
——输入/
——
-output/
-features/
-features.csv(用户创建的功能)
-temp/
-temp.csv(在堆栈中保存的文件)
-scripts/
-script.csv(定义具体模型的主脚本)
-
-这里定义了叠加的基本模型(使用
sklearn.base.baseestimator)。
-这里定义了一些模型。例如,XGBoost、Keras、Vowpal Wabbit。
这些模型被包装为SCIKIT学习(使用< BR/SkLyn.BaseCuffiMyIn,SkPood.Base.ReasReSuxMin)。和
predict()。
可以在此处添加新的用户定义模型。
>基本模型有一些参数。
-'s':叠加。保存一个oof(out-of-fold)
预测({model\u name}u all\u fold.csv)和基于火车折叠模型的平均测试预测({model\u name}u test.csv)。这些
文件将用于下一级堆栈。
-'t':使用所有数据进行训练并预测
测试({model\\u name}\u testinallingdata.csv)。在本培训中,不使用验证数据。
-'s t':堆叠,然后使用所有数据和预测测试(“s”
和“t”)进行培训。
-'cv':仅交叉验证而不保存预测。
在脚本顶部定义task
详细信息。列车和试验特性集在此定义。需要定义cv折叠索引。
可以定义任何级别的堆叠。
-
-
todo list
-
需要更通用的库。
请检查isuues!!
…| pypi版本图像::https://badge.fury.io/py/stacking.svg
:目标:https://badge.fury.io/py/stacking
…|许可证图像::https://img.shields.io/github/license/mashape/apistatus.svg?maxage=2592000
:目标:https://github.com/ikki407/stacking/license