为什么word2vector计算类比在stanfordNLP上不正确

2024-09-30 01:33:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我在斯坦福做作业cs224n。我用的是单词向量“word2vec-google-news-300”。 我喜欢这样:

pprint.pprint(wv_from_bin.most_similar(positive=['woman', 'king'], negative=['man']))

结果是('queen',0.7118192911148071) 我喜欢这样:

pprint.pprint(wv_from_bin.most_similar(positive=['beijing','japan'], negative=['china']))

结果是 (‘东京’,0.511655688258276), 但我为什么这么做:

pprint.pprint(wv_from_bin.most_similar(positive=['beijing','america'], negative=['china']))

最可能是: (“美国”,0.529512882232666),(“奥兰多”,0.5259881019592285)
根据这些向量,为什么会存在不成立的类比


Tags: frommostbinword2vec单词向量pprintsimilar

热门问题