在Python中有没有一种方法可以获得kmeans的簇内距离

2024-10-01 22:36:09 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我是Python新手,正在尝试解决以下问题。非常感谢你的帮助。谢谢你

  1. 如何使用python获得kmeans中的簇内和簇间距离?在
  2. 如何验证簇的质量?有什么方法可以检查成团的质量吗?在
  3. 有没有办法找出哪些因素/变量是影响聚类最显著的特征-特征提取/选择

我在上面的问题1中试过这个,这个方法正确吗??在

dists = euclidean_distances(km.cluster_centers_)
tri_dists = dists[np.triu_indices(4, 1)]
max_dist, avg_dist, min_dist = tri_dists.max(), tri_dists.mean(), tri_dists.min()

print(max_dist, avg_dist, min_dist)

Tags: 方法距离dist质量聚类特征mintri
1条回答
网友
1楼 · 发布于 2024-10-01 22:36:09

避免把多个问题放在一个问题里。在

  1. K均值并不计算所有这些距离。否则它将需要O(n²)时间和内存,这将慢得多!它使用了方差的一个特殊性质(它不只是优化除平方和之外的其他距离的另一个原因)被称为Koenig-Huygens定理。在
  2. 是的,文献中提出过20多个,甚至100个这样的质量指标。但这并不能使选择“最佳”集群变得更加容易:最终,集群对于用户来说是主观的。在
  3. 是的,您可以应用各种技术,从方差分析到因子分析,再到随机森林。在

相关问题 更多 >

    热门问题