在python中什么是集群、相异性和距离?

2024-10-01 17:32:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在看麻省理工学院的OpenCourse6.0002群集视频,我不理解该课程的一些代码。你知道吗

这是什么?你知道吗

for e in initialCentroids:
        clusters.append(cluster.Cluster([e]))

什么是.distance?你知道吗

  for e in examples:
            smallestDistance = e.distance(clusters[0].getCentroid())

什么是.dissimilarity?你知道吗

 minDissimilarity = cluster.dissimilarity(best)

从代码我可以理解他们在做什么,但我想更详细地介绍一下。相关文件将不胜感激!你知道吗


Tags: 代码infor视频examples课程distance群集
1条回答
网友
1楼 · 发布于 2024-10-01 17:32:13

这些术语主要用来描述数据及其相互之间的关系。让我们从集群开始。你知道吗

Cluster是一组观测数据点,在某种意义上可能具有相似的特征。聚类是无监督学习的主要方法。很容易想象-地图是一组集群,按国籍分组,但在ML中,人们可能分散到其他国家-这在某种程度上是正常的。你知道吗

如果我们把distance作为clusters之间的距离,这个术语表示cluster1的质心到cluster2的质心有多远。这个术语也可以指给定的点,通过测量从点到所有簇的质心的距离-在这里点将由具有最小距离的簇拥有。你知道吗

另外dissimilarity描述了与距离相当的值,它说明了数据点与原始质心的不同。意思是说,一旦距离是高-相异性也高,在我看来-不确定这一个。你知道吗

希望有帮助。你知道吗

相关问题 更多 >

    热门问题