AI Facebook AI Research Sequence-to-Sequence Toolkit

fairseq的Python项目详细描述


简介

Fairseq(-py)是一个序列建模工具包,允许研究人员和 开发人员培训翻译、摘要、语言的自定义模型 建模和其他文本生成任务。

新功能:

特点:

FairSeq提供了各种序列到序列模型的参考实现,包括:

另外:

  • 在一台机器上或跨多台机器进行多GPU(分布式)培训
  • 在CPU和GPU上快速生成,实现多种搜索算法:
  • 通过延迟更新,即使在单个GPU上也可以进行大规模的小批量培训
  • 混合精度训练(训练速度更快,gpu内存更少NVIDIA tensor cores
  • 可扩展:轻松注册新的模型、标准、任务、优化器和学习率调度程序

我们还为几个基准测试提供pre-trained models 翻译和语言建模数据集。

Model

要求和安装

  • PyTorch版本>;=1.0.0
  • python版本=3.5
  • 对于培训新机型,您还需要一个nvidia gpu和NCCL

请按照此处的说明安装pytorch:https://github.com/pytorch/pytorch#installation

如果使用Docker,请确保使用 --ipc=host--shm-size作为nvidia-docker run的命令行选项。

Pythorch安装后,您可以使用pip

安装FairSeq
pip install fairseq

在MacOS上,

CFLAGS="-stdlib=libc++" pip install fairseq

从源安装

从源代码安装FairSeq并在本地开发:

git clone https://github.com/pytorch/fairseq
cd fairseq
pip install --editable .

提高了训练速度

通过安装nvidia的 apex带有--cuda_ext选项的库。 Fairseq将自动切换到Apex提供的更快的模块。

入门

full documentation包含指令 开始时,培训新模型并用新模型扩展Fairseq 类型和任务。

预先培训的模型和示例

我们为下面列出的几个任务提供预训练模型和预处理的二值化测试集, 以及示例培训和评估命令。

我们还提供了更详细的自述文件,以重现特定论文的结果:

加入FairSeq社区

许可证

Fairseq(-py)获得麻省理工学院许可。 该许可证也适用于经过培训的模特。

引文

请引用为:

@inproceedings{ott2019fairseq,title={fairseq: A Fast, Extensible Toolkit for Sequence Modeling},author={Myle Ott and Sergey Edunov and Alexei Baevski and Angela Fan and Sam Gross and Nathan Ng and David Grangier and Michael Auli},booktitle={Proceedings of NAACL-HLT 2019: Demonstrations},year={2019},}

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java流收集组合器   文件如何在java中逐个压缩选定的多个文件夹   从Google存储下载数据时发生java SocketTimeoutException   java在安卓应用程序客户端上从python服务器接收值,然后显示与该值对应的mysql数据   数组如何在Java中测试字符串索引是否为Null   java将一串值拆分并放入一个表中   java Spring Memcached注释不缓存   调用pom中设置的环境变量时出现java问题。xml surefire插件   java修复JFrame中重叠的鼠标侦听器   格式化java。sql。日期至yyyyMMdd   java声音剪辑。如果剪辑不正确,isActive应返回true。启动被调用   无根计算机上hadoop中的java格式化namenode   从字符串数组中删除重复项,而无需在Java中进行显式比较   java Eclipse插件安装错误   java webdriver无法在firefox中单击超链接   动画错误。朗。反思。调用目标异常   java试图调用虚拟方法“void”。小装置。编辑文本。在空对象引用上添加TextChangedListener(安卓.text.TextWatcher)”