擅长:python、mysql、java
<p>你得到的是一个二分图。作为一个初步的尝试,听起来你将把邻居列表当作一个0-1向量,在这个向量之间定义某种相似性/相关性。例如,这可能是一个标准化的汉明距离。根据您的操作方式,您将在单个域上获得一个图形—产品代码或所有者。很快就会明白,为什么我把一切都用图形的语言来表达,忍受我吧。现在为什么要坚持使用Python实现呢?对大规模数据进行聚类需要耗费时间和内存。为了摆脱困境,我编写并维护了一个图聚类算法,在生物信息学中得到了广泛的应用。Is是线程化的,接受加权图,并已用于具有数百万个节点和朝向十亿个边的图。有关详细信息,请参阅<a href="http://micans.org/mcl/" rel="noreferrer">http://micans.org/mcl/</a>。当然,如果您搜索stackoverflow和stackexchange,您可能会对一些线程感兴趣。我也推荐Louvain方法,只是我不确定它是否接受加权网络,你可能会产生加权网络。</p>