没有项目描述
cluster的Python项目详细描述
说明
python集群是一个“简单”的包,它允许创建多个组 (簇)列表中的对象。它意味着灵活和有能力 群集任何对象。为了确保这种灵活性,您不仅需要 提供对象列表,还提供一个计算相似性的函数 在两个物体之间。对于简单的数据类型,如整数,可以是 像减法一样简单,但更复杂的计算是可能的。对吗? 现在,可以使用层次化集群生成集群 以及流行的k-均值算法。对于分层算法,有 提供不同的“链接”(单个、完整、平均和uclus)方法。
算法基于在 http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_html/
注意
上面的站点不再可用,但您仍然可以在 Internet存档地址: https://web.archive.org/web/20070912040206/http://home.dei.polimi.it//matteucc/Clustering/tutorial_html/
用法
一个简单的python程序可以如下所示:
>>> from cluster import HierarchicalClustering >>> data = [12,34,23,32,46,96,13] >>> cl = HierarchicalClustering(data, lambda x,y: abs(x-y)) >>> cl.getlevel(10) # get clusters of items closer than 10 [96, 46, [12, 13, 23, 34, 32]] >>> cl.getlevel(5) # get clusters of items closer than 5 [96, 46, [12, 13], 23, [34, 32]]
注意,当您检索一组集群时,它会立即启动 聚类过程,相当复杂。如果要创建群集 对于大型数据集,请考虑在单独的线程中执行此操作。
对于k-means集群,它看起来如下:
>>> from cluster import KMeansClustering >>> cl = KMeansClustering([(1,1), (2,1), (5,3), ...]) >>> clusters = cl.getclusters(2)
传递给getclusters的参数是生成的群集数。