python word2vec上下文相似性使用周围单词

2024-05-01 14:40:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我想使用w2v的嵌入来获得给定上下文(周围单词)的最有可能的替代词,而不是提供一个单独的单词。在

示例: 句子='我想明天放学后去公园'

如果我想找到类似于“park”的候选对象,通常我会利用Gensim模型中的相似性函数

model.most_similar('park')

获得语义相似的单词。然而,这可能会给我类似于动词“park”的单词,而不是我所追求的名词“park”。在

有没有什么方法可以查询模型并将其周围的单词作为上下文来提供更好的候选者?在


Tags: 对象函数模型利用示例parkmodel相似性
1条回答
网友
1楼 · 发布于 2024-05-01 14:40:20

Word2vec基本上不是一种单词预测算法。在内部,它试图进行半预测,以训练其词向量,但通常这些训练预测并不是需要词向量的最终用途。在

也就是说,gensim的最新版本增加了一个predict_output_word()方法(对于某些模型模式)近似于训练期间所做的预测。它可能对你有用。在

或者,检查初始目标词中的单词most_similar()是否与上下文单词有些相似,这可能会有所帮助。在

有一些研究论文是关于如何在单词向量训练过程中消除多个单词词义的歧义(比如“to/park/a car”与“walk in a park/”),但我还没有看到它们在开源库中实现。在

相关问题 更多 >