我试图了解如何操作层次结构集群,但文档也。。。技术?。。。我不明白它是怎么工作的。
有什么教程可以帮助我开始,一步一步地解释一些简单的任务吗?
假设我有以下数据集:
a = np.array([[0, 0 ],
[1, 0 ],
[0, 1 ],
[1, 1 ],
[0.5, 0 ],
[0, 0.5],
[0.5, 0.5],
[2, 2 ],
[2, 3 ],
[3, 2 ],
[3, 3 ]])
我可以很容易地进行层次聚类和绘制树状图:
z = linkage(a)
d = dendrogram(z)
[0,1,2,4,5,6]
元素的那个?
层次聚集聚类(HAC)有三个步骤:
metric
参数)method
参数)做
将完成前两个步骤。因为您没有指定任何参数,所以它使用标准值
metric = 'euclidean'
method = 'single'
因此
z = linkage(a)
将给你一个a
的单链层次聚集簇。这种聚类是一种解决方案的层次结构。从这个层次结构中,您可以获得有关数据结构的一些信息。你现在可以做的是:metric
是合适的,例如cityblock
或chebychev
将不同地量化您的数据(cityblock
、euclidean
和chebychev
对应于L1
、L2
和L_inf
规范)methdos
的不同属性/行为(例如single
、complete
和average
)这是一个开始
给予
相关问题 更多 >
编程相关推荐