与Doc2Vec的相似性

2024-10-01 00:31:19 发布

男 | 程序猿一只，喜欢编程写python代码。

现在，在结束之后，我想计算训练数据中文档的相似性分数。这些文档向量由model.docvecs[0]、model.docvecs[1]等给出

但是当我试着跑的时候，比如说

cossim(model.docvecs[0], model.docvecs[1])

我得到TypeErrorcannot convert dictionary update sequence element #0 to a sequence。如何计算训练数据中文档之间的余弦相似性

Tags：数据文档 https com model 教程相似性 medium

1条回答

网友

1楼 · 发布于 2024-10-01 00:31:19

Here很好地解释了错误的含义

Here很好地解释了您的案例中到底发生了什么

因此，正如keyed vectors文档中提到的，您应该使用model.docvecs.distance(0, 1)来计算两个文档之间的余弦距离