皮尔逊相关在sklearn特征聚集中的应用

2024-09-30 20:18:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个pandas数据帧,有100行和10000个特性。我想通过使用pearson correlation作为sklearn.cluster.FeatureAgglomeration中的亲和力参数来适应数据的层次聚类。在

到目前为止,我已经尝试了两种方法来实现它: 首先是:

feature_agglomator = FeatureAgglomeration(n_clusters=10, affinity=np.corrcoef, linkage='average')

第二个:

^{pr2}$

运行后:

feature_agglomator.fit_transform(X)

两者都以相同的例外结束:

ValueError: The condensed distance matrix must contain only finite values.

我能做些什么让它正常工作?在


Tags: 数据方法pandas参数聚类特性sklearnfeature