擅长:python、mysql、java
<p>首先,您应该考虑是否可以添加更多的RAM。对内存使用量做一些估计,要么根据你拥有的数据进行计算,要么通过读取不同大小的数据的子样本来衡量事物的规模。几GB内存的适度成本可能会为您节省大量的时间和麻烦。在</p>
<p>其次,考虑是否需要实际构建整个图。例如,您可以通过迭代文件并计数来确定顶点的数量及其度数-只需在内存中一次保留一行,再加上计数,这将比图形小得多。知道了度,就可以在找到最大的连通分量时从图中省略任何阶数为1的顶点,然后对省略的节点进行校正。您正在进行数据分析,而不是实现一些通用算法:学习有关数据的简单信息,以便进行更复杂的分析。在</p>