用python聚类文本

2024-06-01 18:48:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我决定使用一些相似性和聚类文本。在

我已经创建了tf-idf和symmatrix的相似性矩阵。现在我想实现一些用于分组的方法。在

我做了一项研究,发现了hcluster和k-means库。在

从准确度来看,哪一个更好?即使没有现成的图书馆,你知道更好的方法吗。如果我知道算法,我可以写代码。在

同样,这条路是O(n^2)。如果我想牺牲一点准确性来赢得计算时间,你有什么建议吗?在


Tags: 方法代码文本算法图书馆tf矩阵聚类