如何在Bert序列分类中使用大于零的批量

from transformers import BertTokenizer, BertForSequenceClassification import torch tokenizer = BertTokenizer.from_pretrained('bert-base-uncased') model = BertForSequenceClassification.from_pretrained('bert-base-uncased') input_ids = torch.tensor(tokenizer.encode("Hello, my dog is cute", add_special_tokens=True)).unsqueeze(0) # Batch size 1 labels = torch.tensor([1]).unsqueeze(0) # Batch size 1 outputs = model(input_ids, labels=labels) loss, logits = outputs[:2]

1条回答

网友

1楼 · 发布于 2024-05-08 20:50:03

在该示例中unsqueeze用于向输入/标签添加维度，因此它是一个大小为(batch_size, sequence_length)的数组。如果要使用批量大小>；1，您可以构建序列数组，如下例所示：

from transformers import BertTokenizer, BertForSequenceClassification
import torch

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertForSequenceClassification.from_pretrained('bert-base-uncased')

sequences = ["Hello, my dog is cute", "My dog is cute as well"]
input_ids = torch.tensor([tokenizer.encode(sequence, add_special_tokens=True) for sequence in sequences])
labels = torch.tensor([[1], [0]]) # Labels depend on the task
outputs = model(input_ids, labels=labels)

loss, logits = outputs[:2]

在该示例中，两个序列都以相同数量的标记进行编码，因此很容易构建包含两个序列的张量，但如果它们具有不同数量的元素，则需要填充序列，并使用注意掩码告诉模型应该关注哪些标记（以便忽略填充值）

在glossary中有一个关于注意面具的条目，解释了它们的用途和用法。在调用模型的forward方法时，将此注意掩码传递给模型

相关问题更多 >

编程相关推荐

热门问题

热门文章