我正在使用fairseq培训一个英语-越南NMT模型
fairseq表示,它正在1个GPU上训练模型。但是,当我检查GPU时,它似乎没有被使用,而且训练过程非常缓慢
screenshot: GPU usage
63k句子语料库的训练:一个纪元大约需要1小时。(型号:fconv)
233k句子语料库的训练:一个纪元大约需要4小时。(型号:变压器)
screenshot: console log
我的GPU是NVIDIA GeForce GTX 1050,CUDA版本是10.2
我是否成功地在GPU上培训了该模型?
很高兴看到您的解决方案/建议
Tags:
目前没有回答
相关问题 更多 >
编程相关推荐