带有脏类别的机器学习。

dirty_cat的Python项目详细描述


dirty_cat是一个python模块,用于机器学习dirty分类变量。

网站:https://dirty-cat.github.io/

对于编码脏分类数据的问题的详细描述, 见Similarity encoding for learning with dirty categorical variables[1]

安装

依赖性

脏猫需要:

  • Python(>;=3.5)
  • 纽比(>;=1.8.2)
  • scipy(>;=1.0.1)
  • 科学套件学习(>;=0.20.0)

可选依赖项:

  • python levenshtein用于更快的编辑距离(不用于n-gram 距离)

用户安装

如果你已经安装了Numpy和Scipy, 安装脏猫最简单的方法是使用pip

pip install -U --user dirty_cat

参考文献

[1]Patricio Cerda, Gaël Varoquaux, Balázs Kégl. Similarity encoding for learning with dirty categorical variables. 2018, Machine Learning journal, Springer.

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
IE中的java跨域cookie问题   重复java中已经满足的循环   编译java RMI服务器时出错   JavaServlet POST中作为参数传递的javascript大型JSON数组数据为空   java片段未每次刷新/调用   java无法编译。错误消息   java如何构造大型类?   java Hibernate:TableThingsDB。事情并不存在   java如何操作从匹配项创建的数组。发现   循环以搜索和显示数组Java的某些部分   加载或注册SQLite JDBC驱动程序时出现java问题   活动和服务之间的java连接   JavaGWTG2D:ie8中的drawImage   java在安卓中设置hessian阈值   在Tomcat中使用Logback时发生java错误