擅长:python、mysql、java
<p>我的感觉是(#翻译成直觉,而不是数学):</p>
<p>相似度将根据这两个词彼此接近或在同一上下文中使用的频率来计算。你知道吗</p>
<p>如果你从那里出发:</p>
<p>如果这两个词事实上是相似的,那么使用频率越高=>;您拥有的训练数据越多=>;模型越好=>;它们就越接近。你知道吗</p>
<p>如果使用这两个词时有更多的上下文,那么它们的关系就会更密切。你知道吗</p>
<p>然而,如果它们在语料库中出现的频率较低,而在一起出现的频率较高,它们之间的关系也会更紧密。你知道吗</p>
<p>所以它更像是一个(frequency\u same\u context)/(frequency\u overall)。
如果你不改变,我想你应该没事吧?你知道吗</p>