为什么word2vector计算类比在stanfordNLP上不正确

2024-09-30 01:33:27 发布

男 | 程序猿一只，喜欢编程写python代码。

我在斯坦福做作业cs224n。我用的是单词向量“word2vec-google-news-300”。我喜欢这样：

pprint.pprint(wv_from_bin.most_similar(positive=['woman', 'king'], negative=['man']))

结果是（'queen'，0.7118192911148071）我喜欢这样：

pprint.pprint(wv_from_bin.most_similar(positive=['beijing','japan'], negative=['china']))

结果是（‘东京’，0.511655688258276），但我为什么这么做：

pprint.pprint(wv_from_bin.most_similar(positive=['beijing','america'], negative=['china']))

最可能是：（“美国”，0.529512882232666），（“奥兰多”，0.5259881019592285）
根据这些向量，为什么会存在不成立的类比

Tags： from most bin word2vec 单词向量 pprint similar

0条回答

目前没有回答