用于递归级联的TensorFlow高效共享内存分配

2024-09-25 00:25:47 发布

您现在位置:Python中文网/ 问答频道 /正文

densenet倾向于在TensorFlow中占用大量内存,因为每个concat操作都存储在单独的分配中。最近的一篇论文Memory-Efficient Implementation of DenseNets演示了通过共享分配可以显著降低内存利用率。这张来自paper+pytorch实现的图像说明了共享内存方法:

densenet shared memory

如何使用TensorFlow实现这一点?如果不能通过python实现,那么如何在支持CPU和GPU的Op中正确地实现它呢?在

我创建了一个TensorFlow Feature Request for necessary allocation functionality。在


Tags: of内存图像tensorflowpytorch利用率implementationpaper