我正在关注Doc2Vec的Gensim教程:https://medium.com/@mishra.thedeepak/doc2vec-simple-implementation-example-df2afbbfbad5
现在,在结束之后,我想计算训练数据中文档的相似性分数。这些文档向量由model.docvecs[0]
、model.docvecs[1]
等给出
但是当我试着跑的时候,比如说
cossim(model.docvecs[0], model.docvecs[1])
我得到TypeErrorcannot convert dictionary update sequence element #0 to a sequence
。如何计算训练数据中文档之间的余弦相似性
Here很好地解释了错误的含义
Here很好地解释了您的案例中到底发生了什么
因此,正如keyed vectors文档中提到的,您应该使用
model.docvecs.distance(0, 1)
来计算两个文档之间的余弦距离相关问题 更多 >
编程相关推荐