关于变张量形状的一个问题

from einops.layers.torch import Rearrange img = torch.randn(1, 3, 256, 256) import copy img2 = copy.deepcopy(img) b, c, h, w = img.size() p=32 to_patch_embedding = nn.Sequential( Rearrange('b c (h p1) (w p2) -> b (h w) (p1 p2 c)', p1=32, p2=32), ) img2 = img2.view(b, h // p * w // p, c * p * p) print(img2.shape) print(img2==to_patch_embedding(img)) ----------------------------------------output-------------------------------------------- torch.Size([1, 64, 3072]) tensor([[[ True, False, False, ..., False, False, False], [False, False, False, ..., False, False, False], [False, False, False, ..., False, False, False], ..., [False, False, False, ..., False, False, False], [False, False, False, ..., False, False, False], [False, False, False, ..., False, False, True]]])

1条回答

网友

1楼 · 发布于 2024-10-01 02:33:25

您可以按照pytorch discuss中提到的方法尝试这种方法

import torch
a = torch.randn(1, 3, 256, 256)
a = a.unfold(2, 32, 32).unfold(3, 32, 32)
a = a.contiguous().view(a.size(0), a.size(2)*a.size(3), a.size(1)*a.size(-1)*a.size(-2))
print(a.shape)

输出形状与您预期的一样：

torch.Size([1, 64, 3072])

希望这对你有用

相关问题更多 >

编程相关推荐

热门问题

热门文章