<p>我正在研究Doc2vec的文本分类。它是为给定大小的句子创建一个向量(例如:100,向量长度)。我不明白它是怎么产生这么长的向量的。在</p>
<p>我正在跟踪<a href="http://linanqiu.github.io/2015/10/07/word2vec-sentiment" rel="nofollow noreferrer">this link</a>。在这里,他们正在为句子创建一个向量,这个向量将保存在doc2v模型中,我不能用这个模型来测试新数据(生产数据),因为没有新句子的向量。显示新数据时出错</p>
<blockquote>
<p>KeyError: "tag 'Test_2028' not seen in training corpus/invalid"</p>
</blockquote>