与Pythorch并行运行一个集成的多个模型

1条回答

网友

1楼 · 发布于 2024-09-25 00:33:19

在Convnd代替Linear的情况下，可以使用groups参数来表示“分组卷积”（又称“depthwise卷积”）。让你同时处理所有的网络。在

如果使用一个1大小的卷积内核，那么卷积除了应用Linear层外什么都不做，其中每个通道都被视为一个输入维。所以你的网络结构大致如下：

修改形状B x dim_state的输入张量如下：添加一个额外的维度并通过nb_state-次B x dim_state复制到B x (dim_state * nb_heads) x 1
将两个Linear替换为

nn.Conv1d(in_channels=dim_state * nb_heads, out_channels=hidden_size * nb_heads, kernel_size=1, groups=nb_heads)

以及

^{pr2}$

现在我们有了一个大小为B x (dim_action x nb_heads) x 1的张量，你现在可以把它修改成你想要的任何形状（例如B x nb_heads x dim_action）

虽然CUDA本机支持分组卷积，但是Pythorch在分组卷积的速度方面存在一些问题（参见示例here），但我认为现在已经解决了。在