提供一个输入csv和一个要预测的目标字段,生成一个model+代码来运行它。

automl_gs的Python项目详细描述


向automl gs提供一个输入csv文件和一个要预测的目标字段,并获得一个经过训练的高性能机器学习或深度学习模型以及本机代码管道,允许您将该模型集成到任何预测工作流中。没有黑匣子:您可以看到确切地如何处理数据,如何构造模型,并且可以根据需要进行调整。

automl gs是一个automl工具,与微软的[nni](https://github.com/Microsoft/nni)、uber的[ludwig](https://github.com/uber/ludwig)和[tpot](https://github.com/EpistasisLab/tpot)不同,它提供了一个零代码/模型定义接口以在多个流行的ml/dl框架中获得优化的模型和数据转换管道,使用最少的python依赖项(pandas+scikit learn+your framework of choice)。automl gs是为没有深厚统计背景的公民数据科学家和工程师设计的,其理念是,你不需要知道任何现代数据预处理和机器学习工程技术,就可以创建一个强大的预测工作流。

如今,计算许多不同模型和超参数的成本远低于数据科学家的时间成本。automl gs是一个python 3模块,旨在抽象出转换表格数据、构建机器学习/深度学习模型以及执行随机超参数搜索以识别性能最佳的模型的常用方法。这使得数据科学家和研究人员能够更好地利用他们的时间进行模型性能优化。

  • 生成本机python代码;无平台锁定,并且在创建模型脚本后无需使用automl gs。
  • 使用google colaboratory中的tpu免费提供列车模型配置超快
  • 处理通常需要手动干预的凌乱数据集,例如日期时间/分类编码和间隔/分隔的列名。
  • 生成的模型管道的每个部分都是它自己的函数w/docstrings,这使得它更容易集成到生产工作流中。
  • 非常详细的度量报告存储在一个整洁的csv中,允许您识别和可视化模型的优点和缺点。
  • 磁盘上数据管道编码器的正确序列化(即没有pickled python对象!)
  • 在新数据上重新训练生成的模型,而不进行任何代码/管道更改。
  • 随时退出超参数搜索,因为每次试用后都会保存结果。

由automl gs生成的模型旨在为解决给定问题提供一个非常强大的baseline;它们并不是automl宣传中经常出现的全部结果,但是生成的代码很容易从基线中得到改进。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
xml如何递归地比较两个相同但未知类型的Java对象的字段值?   javascript如何在SeleniumWebDriver中使用JavascriptExecuter设置属性值   java计算n个布尔值的“真”数   java查找两个相同圆的重叠级别百分比   调用了java onCreateOptionMenu(),但不起作用   java为嵌套类编写toString方法   java如何查找远程JNDI   java如何使用JFileChooser和JLabel将图像上载到JTextArea   java在sling中创建一个新的mixin   使用数据库登录模块导致java Jboss安全web服务错误:EJB调用失败   java int(primitive)值未隐式类型转换为long(primitive)   可比Java   javafx Java组合框将不会被填充   java打印链锯v2中的类名、行号和方法名   Debian:OracleJava9(JDK9)无法定位包