查找一个句子与word2vec模型的可信度/相似性

2024-09-19 20:30:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我为两个不同的主题或类别创建了两个不同的word2vec模型

现在,如果我给一个新的句子作为输入,我如何计算这个句子对两个模型的置信度。我的意思是,我如何计算两个模型中句子的相似度或接近度的百分比

有没有可能得到一个模型的集合向量,这样我就可以将它与一个新句子的向量进行比较

示例-

假设我为体育和学术界创建了两个word2vec模型。我使用不同的句子、预处理等创建了这两个模型

现在,假设我给出一个既有体育又有学术的句子

我如何知道我的句子在体育语境中有多少,在使用现有模型和这个新句子的向量的学者中有多少

比如,我能说我的新句子和体育模型有70%的相似性,和学术模型有50%的相似性吗


Tags: 模型示例主题word2vec相似性类别向量句子