从HuggingFace中的wav2vec2模型获取嵌入

model_name = "facebook/wav2vec2-large-xlsr-53-german" feature_extractor = Wav2Vec2Processor.from_pretrained(model_name) model = Wav2Vec2Model.from_pretrained(model_name) input_values = feature_extractor(train_dataset[:10]["speech"], return_tensors="pt", padding=True, feature_size=1, sampling_rate=16000 ).input_values

1条回答

网友

1楼 · 发布于 2024-09-30 20:30:19

只需检查documentation：

last_hidden_state (torch.FloatTensor of shape (batch_size, sequence_length, hidden_size)) – Sequence of hidden-states at the output of the last layer of the model.
extract_features (torch.FloatTensor of shape (batch_size, sequence_length, conv_dim[-1])) – Sequence of extracted feature vectors of the last convolutional layer of the model.

最后一个_hidden_状态向量表示所谓的contextualized embeddings（即，每个特征（CNN输出）都有一个向量表示，该向量表示在某种程度上受序列的其他标记的影响）
extract_features向量表示输入的嵌入（在CNN之后）。 .

Also, is this the correct way to extract features from a pre-trained model?
Yes.

How one can get embeddings from a specific layer? Set output_hidden_states=True:

o = model(input_values,output_hidden_states=True)
o.keys()

输出：

odict_keys(['last_hidden_state', 'extract_features', 'hidden_states'])

hidden_states值包含每个注意层的嵌入和上下文化嵌入

p.S.：jonatasgrosman/wav2vec2-large-xlsr-53-german模型用feat_extract_norm==层进行训练。也就是说，您还应该向模型传递一个注意遮罩：

model_name = "facebook/wav2vec2-large-xlsr-53-german"
feature_extractor = Wav2Vec2Processor.from_pretrained(model_name)
model = Wav2Vec2Model.from_pretrained(model_name)

i= feature_extractor(train_dataset[:10]["speech"], return_tensors="pt", padding=True, 
                                 feature_size=1, sampling_rate=16000 )
model(**i)

相关问题更多 >

编程相关推荐

热门问题

热门文章

从HuggingFace中的wav2vec2模型获取嵌入

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >