用于产品数据分析的最佳Python集群库

网友

1楼 · 编辑于 2024-09-30 08:22:44

我想你也可以用pycluster来改变你的算法

我想你最好看看这个http://www.dennogumi.org/2007/11/data-clustering-with-python

网友

2楼 · 编辑于 2024-09-30 08:22:44

R语言has many packages for finding groups in data，还有python绑定到R，称为RPy。R提供了这里已经提到的一些算法，并且以在大型数据集上的良好性能而闻名。

网友

3楼 · 编辑于 2024-09-30 08:22:44

你得到的是一个二分图。作为一个初步的尝试，听起来你将把邻居列表当作一个0-1向量，在这个向量之间定义某种相似性/相关性。例如，这可能是一个标准化的汉明距离。根据您的操作方式，您将在单个域上获得一个图形—产品代码或所有者。很快就会明白，为什么我把一切都用图形的语言来表达，忍受我吧。现在为什么要坚持使用Python实现呢？对大规模数据进行聚类需要耗费时间和内存。为了摆脱困境，我编写并维护了一个图聚类算法，在生物信息学中得到了广泛的应用。Is是线程化的，接受加权图，并已用于具有数百万个节点和朝向十亿个边的图。有关详细信息，请参阅http://micans.org/mcl/。当然，如果您搜索stackoverflow和stackexchange，您可能会对一些线程感兴趣。我也推荐Louvain方法，只是我不确定它是否接受加权网络，你可能会产生加权网络。

相关问题更多 >

编程相关推荐

热门问题

热门文章