相同数据和集群数量的不同架构得分

For n_clusters=80, The Silhouette Coefficient is 0.17329035592930178 For n_clusters=100, The Silhouette Coefficient is 0.16970208098407866 For n_clusters=200, The Silhouette Coefficient is 0.1961679920561574 For n_clusters=300, The Silhouette Coefficient is 0.19367019831221857 For n_clusters=400, The Silhouette Coefficient is 0.19818865972762675 For n_clusters=500, The Silhouette Coefficient is 0.19551544844885604 For n_clusters=600, The Silhouette Coefficient is 0.19611760638136203

2条回答

网友

1楼 · 编辑于 2024-10-02 20:37:06

我认为您使用的是sklearn，因此将random_state参数设置为一个数字，应该可以让您对同一k执行不同的k-means时得到可重复的结果。您可以将该数字设置为0、42或任何您想要的值，只要在不同的代码运行中保持相同的数字，结果将是相同的。在

网友

2楼 · 编辑于 2024-10-02 20:37:06

是的，k-means是随机的，所以它并不总是给出相同的结果。在

通常这意味着这个k不好。在

但不要盲目依赖轮廓。找到“最佳”k是不够可靠的。很大程度上，因为通常根本就没有最佳k。在

查看数据，并根据您的理解选择一个好的集群。别指望什么好事会自动出现。在

相关问题更多 >

编程相关推荐

热门问题

热门文章