擅长:python、mysql、java
<p>这似乎是空间中的一个缺陷。在</p>
<p>不知何故,<code>vector_norm</code>计算不正确。在</p>
<pre><code>import spacy
import numpy as np
nlp = spacy.load("en")
# using u"apples" just as an example
apples = nlp.vocab[u"apples"]
print apples.vector_norm
# prints 1.4142135381698608, or sqrt(2)
print np.sqrt(np.dot(apples.vector, apples.vector))
# prints 1.0
</code></pre>
<p>然后<code>vector_norm</code>在<code>similarity</code>中使用,它总是返回一个总是正确值的一半的值。在</p>
^{pr2}$
<p>如果你要对同义词的相似性评分进行排名,这可能是可以的。但是如果你需要正确的余弦相似性分数,那么结果是不正确的。在</p>
<p>我提交了问题<a href="https://github.com/explosion/spaCy/issues/522" rel="noreferrer">here</a>。希望很快就能修好。在</p>