为什么在pyTorch强化学习示例的nn.模块中返回self.head（x.view（x.size（0），1））

print (self.head(x.view(x.size(0), -1))) return self.head(x.view(x.size(0), -1)) tensor([[-0.6945, -0.1930]]) tensor([[-0.0195, -0.1452]]) tensor([[-0.0906, -0.1816]]) tensor([[ 0.0631, -0.9051]]) tensor([[-0.0982, -0.5109]]) ...

class DQN(nn.Module): def __init__(self, h, w, outputs): super(DQN, self).__init__() self.conv1 = nn.Conv2d(3, 16, kernel_size=5, stride=2) self.bn1 = nn.BatchNorm2d(16) self.conv2 = nn.Conv2d(16, 32, kernel_size=5, stride=2) self.bn2 = nn.BatchNorm2d(32) self.conv3 = nn.Conv2d(32, 32, kernel_size=5, stride=2) self.bn3 = nn.BatchNorm2d(32) # Number of Linear input connections depends on output of conv2d layers # and therefore the input image size, so compute it. def conv2d_size_out(size, kernel_size = 5, stride = 2): return (size - (kernel_size - 1) - 1) // stride + 1 convw = conv2d_size_out(conv2d_size_out(conv2d_size_out(w))) convh = conv2d_size_out(conv2d_size_out(conv2d_size_out(h))) linear_input_size = convw * convh * 32 self.head = nn.Linear(linear_input_size, outputs) # Called with either one element to determine next action, or a batch # during optimization. Returns tensor([[left0exp,right0exp]...]). def forward(self, x): x = F.relu(self.bn1(self.conv1(x))) x = F.relu(self.bn2(self.conv2(x))) x = F.relu(self.bn3(self.conv3(x))) return self.head(x.view(x.size(0), -1))

1条回答

网友

1楼 · 发布于 2024-05-20 13:36:20

x.view(x.size(0), -1)正在展平张量，这是因为线性层只接受向量（1d数组）。要分解它，x.view()重塑指定形状的张量（更多info）x.shape(0)返回张量的第一维（即批量大小，应保持不变）。x.view()中的-1是一个填充词，换句话说，它的维度我们不知道，所以PyTorch自动计算它。例如，如果x = torch.tensor([1,2,3,4])，要将张量重塑为2x2，可以执行x.view(2,2)或x.view(2,-1)或x.view(-1,2)。输出形状不是2的张量形状，而是121,2的张量形状（121是批量大小，2来自线性层output）。因此，要将输出大小从2更改为4，必须将__init__函数中的outputs参数更改为4

相关问题更多 >

编程相关推荐

热门问题

热门文章