Pytorch被卡在.to('cuda')或.cuda()

2024-09-28 21:08:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用docker环境来做一些pytorch培训工作,但是经常陷入.to(‘cuda’).cuda()调用。不知道为什么。 我注意到一些系统行为:培训过程的cpu使用率为100%,几乎97%是sys time,如前1所示。我使用strace调试了培训过程,还使用了/proc文件系统,发现该过程一直卡在对管道的poll syscall上,但我不知道pytorch中在哪里使用了管道。你知道吗


Tags: todocker管道环境time过程系统sys