擅长:python、mysql、java
<p>文件上说:</p>
<pre><code>Returns:
score : float
Opposite of the value of X on the K-means objective.
</code></pre>
<p>要理解这意味着什么,你需要看看k-means算法。k-means的本质是寻找能够最小化数据样本与其关联的聚类中心之间距离之和的聚类中心。</p>
<p>这是一个两步过程,其中(a)每个数据样本与其最近的群集中心关联,(b)群集中心调整为位于与其关联的所有样本的中心。重复这些步骤,直到满足一个条件(最近两次迭代之间的最大迭代次数/最小变化次数)。</p>
<p>如您所见,数据样本与其关联的簇中心之间仍有一段距离,我们最小化的<em>目标</em>就是该距离(所有距离的总和)。</p>
<p>如果数据样本的种类繁多,如果数据样本的数量明显高于集群的数量(在您的情况下,集群的数量仅为<em>two</em>),那么自然会有很大的距离。相反,如果所有的数据样本都是相同的,那么不管集群的数量是多少,都会得到一个零距离。</p>
<p>不过,从文档中可以看出,所有值都是负值。如果你同时观察到消极和积极的价值观,也许还有比这更重要的东西。</p>
<p>我不知道你是怎么想到要分为两类的。</p>