fairseq toolkit未使用GPU训练NMT模型

2024-06-01 10:30:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用fairseq培训一个英语-越南NMT模型

fairseq表示,它正在1个GPU上训练模型。但是,当我检查GPU时,它似乎没有被使用,而且训练过程非常缓慢

screenshot: GPU usage

63k句子语料库的训练:一个纪元大约需要1小时。(型号:fconv)

233k句子语料库的训练:一个纪元大约需要4小时。(型号:变压器)

screenshot: console log

我的GPU是NVIDIA GeForce GTX 1050,CUDA版本是10.2

我是否成功地在GPU上培训了该模型?

很高兴看到您的解决方案/建议


Tags: 模型gpu过程usageconsole句子语料库小时