scikit learn的第三方扩展包
sklearn-extensions的Python项目详细描述
0.0.1版
scikit learn extensions(sklearn_extensions)是[scikit learn](https://github.com/sklearn/sklearn)扩展的单一源存储库。它是有意的 为了赞扬scikit learn在添加新的预测因子和模块方面更为缓慢和谨慎的做法,使用 为可能不符合这些标准的sklearn兼容模块提供单独的pip可安装源代码。
特别是,这个项目对较小的一次性项目感兴趣,特别是gist,而不是更大的 已建立的(如2号塔、生命线或闪电)。除了大项目,我们会回避项目 具有显著的外部依赖性(即围绕vowpal wabbit或xgboost的包装),更喜欢 基于python/numpy/scipy的项目。
由于这些指导目标,此处包含的模块可能没有包含的模块经过良好测试、生产就绪或稳定 直接在sklearn。这几乎就是蛮荒的西部,测试任何大量使用这个包的东西。
文档位于:
[http://wdm0006.github.io/sklearn-extensions](http://wdm0006.github.io/sklearn-extensions)
安装/使用
我们的目标是首先支持python 3,并且托管在pypi上,因此只需安装:
pip install sklearn-extensions
注意,这里的安装将安装所有底层软件包,因此相当大。建议 你是在虚拟机里做的。
目前包括的扩展名
- [Kernel Regression](https://github.com/jmetzen/kernel_regression)
- [Fuzzy K-Means](https://gist.github.com/mblondel/1451300)
- [Sparse Filtering](https://github.com/jmetzen/sparse-filtering)
- [Extreme Learning Machines](https://github.com/dclambert/Python-ELM)
- [Non-negative Garotte](https://gist.github.com/agramfort/2351057)
待办事项
已经确定了一些包,但尚未添加。作为确定潜在项目的一般规则 要添加到sklearn扩展,如果无法安装pip:it可能是这里的候选者
- [Optimal Path Forest Classifiers](https://github.com/LibOPF/LibOPF)
- [Random Output Trees](https://github.com/arjoly/random-output-trees)
- [Simple MLP](https://gist.github.com/amueller/2061456)
- [Kernel SGD](https://gist.github.com/mblondel/2573392)
- [Kernel K-Means](https://gist.github.com/mblondel/6230787)
- [Non-Negative Least Squares](https://gist.github.com/mblondel/4421380)
- [Non-Negative Matrix Factorization](https://gist.github.com/omangin/8801846)
- [K-means Feature Mapper](https://gist.github.com/larsmans/5996074)
- [NMF via Coordinate Descent](https://gist.github.com/mblondel/09648344984565f9477a)
- [Pegasos](https://github.com/ejlb/pegasos)
- [Gaussian Processes](https://github.com/jmetzen/skgp)
- [Pinch Ratio Clustering](https://github.com/rsbowman/sklearn-prc)
- [py-soft-impute](https://github.com/travisbrady/py-soft-impute)
如果你还有什么建议,请随时补充,或者告诉我,我会尽力的。
贡献
如果您有要添加的扩展名,请提交拉取请求,我们可以将其加入。主要好处 因此,为了 管理层,项目的代码将在这里复制。本着开放源码软件的精神,我们还将致力于为 有意义的变化回到原来的项目以及。
新软件包的完整添加包含几个组件:
- Actual addition of package into sklearn_extensions directory
- Documentation of the included transformers/predictors in the sklearn_extensions docs
- An example or two (included in the aforementioned docs as well) in the examples directory
- A test or two, more if the source package has poor testing coverage
许可证
在大多数情况下,sklearn_扩展对外部项目所做的就是包括它们。所有的项目都将保留 隔离到他们自己的子目录中,并在这些子目录中携带他们的原始许可证。
所有与本项目相关的材料(特别是任何文档、测试、示例或原始代码)都在 BSD 3条款许可证。捆绑包中包含的任何软件包都保留其原始许可证(包含在其子目录中)