为什么在pyTorch强化学习示例的nn.模块中返回self.head(x.view(x.size(0),1))

2024-05-20 13:36:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我知道平衡杆示例需要2个输出Reinforcement Learning (DQN) Tutorial

这是self.head的输出

  print ('x',self.head)  
  x = Linear(in_features=512, out_features=2, bias=True)

当我运行EPOCH时,以下是输出:

print (self.head(x.view(x.size(0), -1)))
return self.head(x.view(x.size(0), -1))

tensor([[-0.6945, -0.1930]])
tensor([[-0.0195, -0.1452]])
tensor([[-0.0906, -0.1816]])
tensor([[ 0.0631, -0.9051]])
tensor([[-0.0982, -0.5109]])
...

x的大小为:

x = torch.Size([121, 32, 2, 8])

所以我试图理解x.view(x.size(0),-1)在做什么

我从代码中的注释中了解到它返回: 返回张量([[left0exp,right0exp]…])

但是x,也就是火炬的大小([121,32,2,8])是如何被减少到一个大小为2的张量的呢

有没有其他更有意义的写作方式?如果我有4个输出呢。我将如何陈述这一点?为什么是x.size(0)。为什么是-1?
因此,似乎将self.head与4个输出转换为2个输出。对吗

下面是我所指的班级:

class DQN(nn.Module):

    def __init__(self, h, w, outputs):
        super(DQN, self).__init__()
        self.conv1 = nn.Conv2d(3, 16, kernel_size=5, stride=2)
        self.bn1 = nn.BatchNorm2d(16)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=5, stride=2)
        self.bn2 = nn.BatchNorm2d(32)
        self.conv3 = nn.Conv2d(32, 32, kernel_size=5, stride=2)
        self.bn3 = nn.BatchNorm2d(32)

        # Number of Linear input connections depends on output of conv2d layers
        # and therefore the input image size, so compute it.
        def conv2d_size_out(size, kernel_size = 5, stride = 2):
            return (size - (kernel_size - 1) - 1) // stride  + 1
        convw = conv2d_size_out(conv2d_size_out(conv2d_size_out(w)))
        convh = conv2d_size_out(conv2d_size_out(conv2d_size_out(h)))
        linear_input_size = convw * convh * 32
        self.head = nn.Linear(linear_input_size, outputs)

    # Called with either one element to determine next action, or a batch
    # during optimization. Returns tensor([[left0exp,right0exp]...]).
    def forward(self, x):
        x = F.relu(self.bn1(self.conv1(x)))
        x = F.relu(self.bn2(self.conv2(x)))
        x = F.relu(self.bn3(self.conv3(x)))
        return self.head(x.view(x.size(0), -1))

Tags: selfviewinputsizereturndefdqnnn
1条回答
网友
1楼 · 发布于 2024-05-20 13:36:20

x.view(x.size(0), -1)正在展平张量,这是因为线性层只接受向量(1d数组)。要分解它,x.view()重塑指定形状的张量(更多infox.shape(0)返回张量的第一维(即批量大小,应保持不变)。x.view()中的-1是一个填充词,换句话说,它的维度我们不知道,所以PyTorch自动计算它。例如,如果x = torch.tensor([1,2,3,4]),要将张量重塑为2x2,可以执行x.view(2,2)x.view(2,-1)x.view(-1,2)。 输出形状不是2的张量形状,而是121,2的张量形状(121是批量大小,2来自线性层output)。因此,要将输出大小从2更改为4,必须将__init__函数中的outputs参数更改为4

相关问题 更多 >