关于余弦相似性，如何选择损失函数和网络（我有两个方案）问题的回答

关于余弦相似性，如何选择损失函数和网络（我有两个方案）

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

对不起，我不知道该怎么解决。我使用两个网络来构造两个嵌入，我有一个二进制目标来指示embeddingA和embeddingB是否匹配（1或-1）。数据集如下所示： <pre><code>embA0 embB0 1.0 embA1 embB1 -1.0 embA2 embB2 1.0 ... </code></pre> 我希望使用余弦相似性来得到分类结果。但我在选择损失函数时感到困惑，生成嵌入的两个网络是分开训练的，现在我可以想到以下两个选项： 计划1: 构造第三个网络，使用EmbeddedingA和EmbeddedingB作为nn.cosinesimilarity（）的输入来计算最终结果（应为[-1,1]中的概率），然后选择一个两类损失函数 （对不起，我不知道该选择哪个损失函数。） <pre><code>class cos_Similarity(nn.Module): def __init__(self): super(cos_Similarity,self).__init__() cos=nn.CosineSimilarity(dim=2) embA=generator_A() embB=generator_B() def forward(self,a,b): output_a=embA(a) output_b=embB(b) return cos(output_a,output_b) loss_func=nn.CrossEntropyLoss() y=cos_Similarity(a,b) loss=loss_func(y,target) acc=np.int64(y>0) </code></pre> 计划2: 这两个嵌入作为输出，然后使用nn.cosinembeddingloss（）作为损失函数，当我计算精度时，我使用nn.Cosinesimilarity（）输出结果（概率为[-1,1]） <pre><code>output_a=embA(a) output_b=embB(b) cos=nn.CosineSimilarity(dim=2) loss_function = torch.nn.CosineEmbeddingLoss() loss=loss_function(output_a,output_b,target) acc=cos(output_a,output_b) </code></pre> 我真的需要帮助。我如何做出选择？为什么？或者我只能通过实验结果为自己做出选择。多谢各位 ###################################### <pre><code> def train_func(train_loss_list): train_data=load_data('train') trainloader = DataLoader(train_data, batch_size=BATCH_SIZE) cos_smi=nn.CosineSimilarity(dim=2) train_loss = 0 for step,(a,b,target) in enumerate(trainloader): try: optimizer.zero_grad() output_a = model_A(a) #generate embA output_b = model_B(b) #generate embB acc=cos_smi(output_a,output_b) loss = loss_fn(output_a,output_b, target.unsqueeze(dim=1)) train_loss += loss.item() loss.backward() optimizer.step() train_loss_list.append(loss) if step%10==0: print('train:',step,'step','loss:',loss,'acc',acc) except Exception as e: print('train:',step,'step') print(repr(e)) return train_loss_list,train_loss/len(trainloader) </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

作为对注释线程的响应 目标或管道似乎是： <ol> <li>接收两个嵌入向量（例如，A和B）</李> <li>检查这两个向量是否“相似”（使用余弦相似性）</李> <li>如果它们相似，则标签为1，否则为-1（我建议将其更改为0或1，而不是-1和1）</李> </ol> 我能想到的是以下几点。如果我误解了什么，请纠正我。免责声明是，我几乎是根据我的直觉编写的，不知道任何细节，所以如果你尝试运行，它可能会充满错误。让我们仍然尝试获得高层次的理解 <h3>型号</h3> <pre><code>import torch import torch.nn as nn class Model(nn.Module): def __init__(self, num_emb, emb_dim): # I'm assuming the embedding matrices are same sizes. self.embedding1 = nn.Embedding(num_embeddings=num_emb, embedding_dim=emb_dim) self.embedding2 = nn.Embedding(num_embeddings=num_emb, embedding_dim=emb_dim) self.cosine = nn.CosineSimilarity() self.sigmoid = nn.Sigmoid() def forward(self, a, b): output1 = self.embedding1(a) output2 = self.embedding2(b) similarity = self.cosine(output1, output2) output = self.sigmoid(similarity) return output </code></pre> <h3>培训/评估</h3> <pre><code>model = Model(num_emb, emb_dim) if torch.cuda.is_available(): model = model.to('cuda') model.train() criterion = loss_function() optimizer = some_optimizer() for epoch in range(num_epochs): epoch_loss = 0 for batch in train_loader: optimizer.zero_grad() a, b, label = batch if torch.cuda.is_available(): a = a.to('cuda') b = b.to('cuda') label = label.to('cuda') output = model(a, b) loss = criterion(output, label) loss.backward() optimizer.step() epoch_loss += loss.cpu().item() print("Epoch %d \t Loss %.6f" % epoch, epoch_loss) </code></pre> 我省略了一些细节（例如，超参数值、损失函数和优化器等）。这整个过程和你想要的类似吗

关于余弦相似性，如何选择损失函数和网络（我有两个方案）

1 个回答

相关Python问题