为什么在gensim word2vec中会创建多个模型文件?

2024-09-30 14:24:57 发布

您现在位置:Python中文网/ 问答频道 /正文

当我尝试创建一个word2vec模型(带有负采样的skipgram)时,我收到了3个文件作为输出,如下所示。在

word2vec (File)
word2vec.syn1nef.npy (NPY file)
word2vec.wv.syn0.npy (NPY file)

我只是担心为什么会发生这种情况,因为我之前在word2vec中的测试示例我只收到了一个模型(没有npy文件)。在

请帮帮我。在


Tags: 文件模型示例情况word2vecfilenpy帮帮我
1条回答
网友
1楼 · 发布于 2024-09-30 14:24:57

具有较大内部向量数组的模型不能通过Python“pickle”保存到单个文件中,因此超过某个阈值后,gensimsave()方法将使用numpy数组的更有效的原始格式(.npy格式)将子数组存储在单独的文件中。在

您仍然可以通过指定根模型文件名来load()创建模型;当需要子数组时,加载代码将找到副文件——只要它们保存在根文件旁边。因此,在将模型移动到其他位置时,请确保将具有相同根文件名的所有文件放在一起。在

相关问题 更多 >