使用td.cond在训练期间会导致减少吞吐量。在使用resnet50进行imagenet训练的过程中,我们使用LAR更新学习率并计算训练每个步骤的LR。培训的吞吐量约为5500。为此,我们打算每隔几步优化和计算LR操作,以提高吞吐量。在原始代码中 ...2024-10-01 已阅读: n次