自动深度学习,实现图像、视频、文本、语音、表格数据的全自动多标签分类。

autodl-gpu的Python项目详细描述


英语| 简体中文

GitHub issuesGitHub forksGitHub starsGitHub release (latest by date)GitHub licenseimgimg

1。NeurIPS AutoDL挑战第一解决方案

imgimg

1st对于AutoDL Challenge@NeurIPS的解决方案,可以在AutoDL Competition找到竞争规则。在

1.0.1条。动机

现实世界中存在着一系列常见而棘手的问题,如有限的资源(CPU/memory)、数据倾斜、手工艺特征、模型选择、网络结构细节调整、预训练模型的敏感性、超参数的敏感性等。如何全面有效地解决这些问题?在

1.0.2条。解决方案

AutoDL致力于开发各种模式的多标签分类问题的通用算法:图像、视频、语音、文本和表格数据,无需任何人工干预。10秒我们的解决方案在所有24个离线数据集和15个在线数据集上实现了SOTA性能,击败了世界上许多顶尖的提供商。在

1.1条。目录

1.2条。特点

  • Full AutoML/AutoDL:全自动深度学习,无需任何人工干预,覆盖整个管道。在
  • Generic&Universal:支持任何形式(图像、视频、语音、文本、表格)数据和ANY分类问题,包括二进制类、多类和多标签问题。在
  • SOTA:AutoDL挑战赛的赢家解决方案,包括传统机器学习模型和深度学习模型主干。在
  • 开箱即用:您可以使用现成的解决方案。在
  • Fast:您可以最快在10秒内训练您的模型,以获得极具竞争力的性能。在
  • Real-time:您可以实时获得性能反馈(AUC分数)。在

1.3条。评价

  • 反馈阶段排行榜:DeepWithTop 1,平均排名1.2,赢得5个数据集中的4个。img

  • 最终阶段排行榜可视化:DeepWithTop 1,平均排名1.2,在10个数据集中赢得7个。img

1.4条。安装

这个回购在python3.6+、PyTorch 1.0.0+和TensorFlow 2.0上进行了测试。在

您应该在virtual environment中安装AutoDL。如果您不熟悉Python虚拟环境,请查看user guide。在

使用要使用的Python版本创建一个虚拟环境并激活它。在

现在,如果您想使用AutoDL,可以用pip安装它。在

1.4.1条。有pip

可以使用pip安装AutoDL,如下所示:

pip install autodl-gpu 
pip install autodl-gpu=1.0.0 

1.5条。快速游览

1.5.1条。运行本地测试程序

Quick Tour - Run local test tour。在

1.5.2条。图像分类之旅

Quick Tour - Image Classification Demo。在

1.5.3条。视频分类之旅

Quick Tour - Video Classification Demo。在

1.5.4条。语音分类之旅

Quick Tour - Speech Classification Demo。在

1.5.5条。文本分类之旅

Quick Tour - Text Classification Demo。在

1.5.6条。表格分类之旅

Quick Tour - Tabular Classification Demo。在

1.6条。公共数据集

1.6.1条。可选:下载公共数据集

^{pr2}$

1.6.2条。公共数据集示例信息

#NameTypeDomainSizeSourceData (w/o test labels)Test labels
1MunsterImageHWR18 MBMNISTmunster.datamunster.solution
2CityImageObjects128 MBCifar-10city.datacity.solution
3ChuckyImageObjects128 MBCifar-100chucky.datachucky.solution
4PedroImagePeople377 MBPA-100Kpedro.datapedro.solution
5DecalImageAerial73 MBNWPU VHR-10decal.datadecal.solution
6HammerImageMedical111 MBHam10000hammer.datahammer.solution
7KreaturVideoAction469 MBKTHkreatur.datakreatur.solution
8Kreatur3VideoAction588 MBKTHkreatur3.datakreatur3.solution
9KrautVideoAction1.9 GBKTHkraut.datakraut.solution
10KatzeVideoAction1.9 GBKTHkatze.datakatze.solution
11data01SpeechSpeaker1.8 GB--data01.datadata01.solution
12data02SpeechEmotion53 MB--data02.datadat02.solution
13data03SpeechAccent1.8 GB--data03.datadata03.solution
14data04SpeechGenre469 MB--data04.datadata04.solution
15data05SpeechLanguage208 MB--data05.datadata05.solution
16O1TextComments828 KB--O1.dataO1.solution
17O2TextEmotion25 MB--O2.dataO2.solution
18O3TextNews88 MB--O3.dataO3.solution
19O4TextSpam87 MB--O4.dataO4.solution
20O5TextNews14 MB--O5.dataO5.solution
21AdultTabularCensus2 MBAdultadult.dataadult.solution
22DilbertTabular--162 MB--dilbert.datadilbert.solution
23DigitsTabularHWR137 MBMNISTdigits.datadigits.solution
24MadelineTabular--2.6 MB--madeline.datamadeline.solution

1.7条。用于AutoDL本地开发和测试

第1页。Git克隆回购

cd <path_to_your_directory>
git clone https://github.com/DeepWisdom/AutoDL.git
  1. 准备经过预训练的模型。 下载模型speech_model.h5,并将其放入AutoDL_sample_code_submission/at_speech/pretrained_models/目录。在

  2. 在可选:使用docker在与挑战平台完全相同的环境中运行。在

    • 中央处理器
    cd path/to/autodl/
    docker run -it -v "$(pwd):/app/codalab" -p 8888:8888 evariste/autodl:cpu-latest
    
    • GPU
    nvidia-docker run -it -v "$(pwd):/app/codalab" -p 8888:8888 evariste/autodl:gpu-latest
    
  3. 使用AutoDL_sample_data中的玩具数据准备示例数据集或下载新的数据集。在

  4. 运行本地测试

python run_local_test.py

完全的用法是

python run_local_test.py -dataset_dir='AutoDL_sample_data/miniciao' -code_dir='AutoDL_sample_code_submission'

然后,您可以通过打开 AutoDL_scoring_output/中的HTML页。在

详情见AutoDL Challenge official starting_kit。在

1.8条。贡献

尽情潜水吧!Open an issue或提交pr。在

1.9条。联系我们

img

1.10条。加入社区

扫描二维码,加入AutoDL社区!在

1.11条。许可证

Apache License 2.0

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何将cassandra中的行数据转换为与列相关的嵌套json   java如何使用jcr XPath在jcr:content/@jcr:data中搜索?   java在使用openCV进行安卓开发时如何利用手机的广角镜头   java解析扩展了接口,结束了一个潜在的无限循环   位置服务的@Override方法中存在java Android应用程序错误   java本地线程的用途和需求是什么   具有左右子访问的java节点树遍历   java验证JsonWebToken签名   JUL日志处理程序中的java日志记录   嵌入式Java读取给定时间段的串行数据。   java有没有办法从多个URL获取多个图像?   java线程通过等待intent阻止自己发送intent   java Spring MVC解析多部分内容请求   java JPA/Hibernate静态元模型属性未填充NullPointerException   java格式错误的字符(需要引号,得到I)~正在处理   java为什么PrintWriter对象抛出FileNotFoundException?   java Neo4j未正确保存标签   java IE不加载图像