硬投票分类器的特征选择

binsel的Python项目详细描述


Build StatusBinder

硬投票分类器的特征选择

目录

安装

binselgit repo可用作PyPi package

pip install binsel

用法

检查笔记本的^{} example文件夹

算法

任务是从许多二进制特性池中选择例如n_select=3二进制特性。 这些二值特征可能是对二值分类器的预测。 然后将所选的二进制特征组合成一个硬投票分类器

投票分类器应具有以下属性

  • 每个投票者(二进制特性)都应该与目标变量高度相关
  • 选定的二进制特征应不相关。

算法的工作原理如下

  1. 通过引导生成多个相关矩阵(请参见^{})。这包括corr(X_i, X_j)以及corr(Y, X_i)计算同时存储oob样本以供评估。
  2. 对于每个相关矩阵… a.预先选择具有最高abs(corr(Y, X_i))估计值的i*(例如,选择n_pre=?最高绝对相关性) b.切片相关矩阵corr(X_i*, X_j*),找出n_select=?特征的最小相关组合。(见^{}) c.使用选定的n_select=?二进制功能计算硬投票者的包外(oob)性能(请参见步骤1)。
  3. 选择具有最佳oob性能的二进制特征组合作为最终模型。

命令

  • 检查语法:flake8 --ignore=F401
  • 运行单元测试:python -W ignore -m unittest discover
  • 删除.pyc文件:find . -type f -name "*.pyc" | xargs rm
  • 删除__pycache__文件夹:find . -type d -name "__pycache__" | xargs rm -rf
  • 用绳线上传到pypi:python setup.py sdist && twine upload -r pypi dist/*

支架

open an issue支持。

贡献

请使用Github Flow投稿。创建分支、添加提交和open a pull request

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java无法将PowerMockito与PowerMockRunnerDelegate设置为SpringJUnit4ClassRunner一起使用   java如何将对象转换为Inputstream   java从Firebase数据库获取用户对象   java从JSON Android获取Int值   arraylist定义Java中用户定义类的二进制搜索   使用Java将参数附加到url   javascript屏蔽ui wicket数据源   Wicket上的java单选按钮在组中不起作用   具有自签名证书的java SSLHandshakeException   如何编写Java程序来打开特定的文件扩展名(.pef)?   Akka 2.3.14和Java 7如何配置TLS   部署servlet时spring“java.lang.IllegalStateException:无ServletContext集”   java如何在eclipse:eclipse之后在maven中执行代码?   第一个位置没有空格的java正则表达式   java在单个节点的Spark中运行计算