Python中带链接的内存有效聚集聚类

2024-09-26 22:12:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我想把地图上的二维点(纬度/经度)聚集起来。点数为400K,因此输入矩阵为400K×2。在

当我运行scikit-learn's Agglomerative Clustering时,内存不足,内存大约为500GB。在

class sklearn.cluster.AgglomerativeClustering(n_clusters=2, affinity='euclidean', memory=Memory(cachedir=None), connectivity=None, n_components=None, compute_full_tree='auto', linkage='ward', pooling_func=<function mean at 0x2b8085912398>)[source]

我也尝试了memory=memory(cachedir)选项,但没有成功。有没有人有什么建议(另一个库或修改scikit代码),让我可以对数据运行聚类算法?在

我已经在小数据集上成功地运行了该算法。在


Tags: 数据内存算法none地图矩阵scikitlearn

热门问题