我是使用python学习数据分析的新手
我有一个关于如何在稀疏矩阵上分类或聚类的问题。我有这样一个稀疏矩阵:
A B C D E
day1 0 0 1 0 1
day2 0 1 0 0 0
day3 0 0 1 0 1
day4 0 0 1 1 0
day5 1 0 0 1 1
day6 1 0 0 0 1
day7 0 1 1 0 0
day8 1 1 0 1 1
day9 1 0 0 0 1
day10 0 0 1 0 0
每列表示当天运行的作业,我想计算两天之间的相似性,以便将每天分配到集群中
我希望我的输出如下所示:
A B C D E Group
day1 0 0 1 0 1 1
day2 0 1 0 0 0 2
day3 0 0 1 0 1 1
day4 0 0 1 1 0 1
day5 1 0 0 1 1 3
day6 1 0 0 0 1 1
day7 0 1 1 0 0 1
day8 1 1 0 1 1 3
day9 1 0 0 0 1 1
day10 0 0 1 0 0 2
我不知道真正的集群索引应该是什么样的,所以我编了一个
有没有人告诉我应该使用哪种算法或集群方法来解决这个问题?我真的很感激
目前没有回答
相关问题 更多 >
编程相关推荐