Python sklearn-compiledtrees包_程序模块 - PyPI

编译的scikit学习决策树用于更快的评估

sklearn-compiledtrees的Python项目详细描述

安装

在麻省理工学院的许可下发布。

pip install sklearn-compiledtrees

基本原理

在某些用例中，对给定模型的预测处于热路径中，因此加快决策树评价是非常有用的。

加快决策树评价的有效途径是生成表示树的计算的代码，将其编译为优化目标代码，并通过dlopen/dlsym动态加载该文件或同等的。

见 https://courses.cs.washington.edu/courses/cse501/10au/compile-machlearn.pdf 进行详细讨论，以及 http://tullo.ch/articles/decision-tree-evaluation/更多教学解释和更多的基准在C++中。

这个包为简单的单一输出回归树或集合的情况。

它已经在OSX和Linux上测试过了。我们目前没有支持windows平台进行编译后的评估，尽管这应该不是一个很大的工作量。

用法

importcompiledtreesimportsklearn.ensembleX_train,y_train,X_test,y_test=...clf=ensemble.GradientBoostingRegressor()clf.fit(X_train,y_train)compiled_predictor=compiledtrees.CompiledRegressionPredictor(clf)predictions=compiled_predictor.predict(X_test)

基准

对于随机森林，我们在评估中看到5到8倍的加速。对于渐变增强的合奏，在评估中的加速是1.5倍到3倍。这是因为梯度增强树已经有了优化预测实现。

有一个附加的基准脚本允许我们检查在一系列集成配置和数据集。

在所附的图中，GB是梯度增强的，RF是随机的林、D1等对应于设置max-depth=1和B10 对应于设置max_leaf_nodes=10。

图表

for dataset in friedman1 friedman2 friedman3 uniform hastie;do
    python ../benchmarks/bench_compiled_tree.py \
        --iterations=10\
        --num_examples=1000\
        --num_features=50\
        --dataset=$dataset\
        --max_estimators=300\
        --num_estimator_values=6done

timings3907426606273805268 timings-1162001441413946416 timings5617004024503483042 timings2681645894201472305 timings2070620222460516071

欢迎加入QQ群-->： 979659372

sklearn-compiledtrees 1.2

sklearn-compiledtrees的Python项目详细描述

安装

基本原理

用法

基准

图表

推荐PyPI第三方库

qcrop

mypy-boto3-rekognition

sqlight

ckan-remote-dataloader

tucuxi

john

007

torcharc

odoo13-addon-sale-timesheet-task-exclude

pytwoway-pkg

zorroclient

friendly-package

datasette-insert-unsafe

ideabox.stats

hybridtfidf

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

sklearn-compiledtrees 1.2

sklearn-compiledtrees的Python项目详细描述

安装

基本原理

用法

基准

图表

推荐PyPI第三方库

qcrop

mypy-boto3-rekognition

sqlight

ckan-remote-dataloader

tucuxi

john

007

torcharc

odoo13-addon-sale-timesheet-task-exclude

pytwoway-pkg

zorroclient

friendly-package

datasette-insert-unsafe

ideabox.stats

hybridtfidf

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签