层次聚类算法(信息论)
dedupe-hcluster的Python项目详细描述
这个库提供了用于分层集群的python函数。它的特点 包括
- generating hierarchical clusters from distance matrices
- computing distance matrices from observation vectors
- computing statistics on clusters
- cutting linkages to generate flat clusters
- and visualizing clusters with dendrograms.
该接口与Matlab的统计工具箱API非常相似,可以生成代码 更容易从Matlab移植到Python/Numpy。这个的核心实现 为了提高效率,图书馆采用C语言。