稀疏矩阵上的聚类

2024-09-22 16:23:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我是使用python学习数据分析的新手

我有一个关于如何在稀疏矩阵上分类或聚类的问题。我有这样一个稀疏矩阵:

        A   B   C   D   E   
day1    0   0   1   0   1   
day2    0   1   0   0   0   
day3    0   0   1   0   1   
day4    0   0   1   1   0   
day5    1   0   0   1   1   
day6    1   0   0   0   1   
day7    0   1   1   0   0   
day8    1   1   0   1   1   
day9    1   0   0   0   1   
day10   0   0   1   0   0   

每列表示当天运行的作业,我想计算两天之间的相似性,以便将每天分配到集群中

我希望我的输出如下所示:

        A   B   C   D   E   Group
day1    0   0   1   0   1   1
day2    0   1   0   0   0   2
day3    0   0   1   0   1   1
day4    0   0   1   1   0   1
day5    1   0   0   1   1   3
day6    1   0   0   0   1   1
day7    0   1   1   0   0   1
day8    1   1   0   1   1   3
day9    1   0   0   0   1   1
day10   0   0   1   0   0   2

我不知道真正的集群索引应该是什么样的,所以我编了一个

有没有人告诉我应该使用哪种算法或集群方法来解决这个问题?我真的很感激


Tags: 分类集群矩阵聚类新手day1day4day2