Python中PCA的累积解释方差

library(FactoMineR) a <- c(1, 2, 3, 4, 5) b <- c(4, 2, 9, 23, 3) c <- c(9, 8, 7, 6, 6) d <- c(45, 36, 74, 35, 29) df <- data.frame(a, b, c, d) df_pca <- PCA(df, ncp = 4, graph=F) print(df_pca$eig$`cumulative percentage of variance`)

import pandas as pd from sklearn import decomposition, linear_model a = [1, 2, 3, 4, 5] b = [4, 2, 9, 23, 3] c = [9, 8, 7, 6, 6] d = [45, 36, 74, 35, 29] df = pd.DataFrame({'a': a, 'b': b, 'c': c, 'd': d}) pca = decomposition.PCA(n_components = 4) pca.fit(df) transformed_pca = pca.transform(df) # sum cumulative variance from each var cum_explained_var = [] for i in range(0, len(pca.explained_variance_ratio_)): if i == 0: cum_explained_var.append(pca.explained_variance_ratio_[i]) else: cum_explained_var.append(pca.explained_variance_ratio_[i] + cum_explained_var[i-1]) print(cum_explained_var)

1条回答

网友

1楼 · 发布于 2024-09-19 23:44:42

感谢Vlo，我了解到FactoMineR PCA函数和sklearn PCA函数之间的区别在于FactoMineR one在默认情况下缩放数据。只需在python代码中添加一个缩放函数，就可以重现结果。在

import pandas as pd
from sklearn import decomposition, preprocessing

a = [1, 2, 3, 4, 5]
b = [4, 2, 9, 23, 3]
c = [9, 8, 7, 6, 6]
d = [45, 36, 74, 35, 29]
e = [35, 84, 3, 54, 68]


df = pd.DataFrame({'a': a,
                  'b': b,
                  'c': c, 
                  'd': d})


pca_data = preprocessing.scale(df)

pca = decomposition.PCA(n_components = 4)
pca.fit(pca_data)
transformed_pca = pca.transform(pca_data)

cum_explained_var = []
for i in range(0, len(pca.explained_variance_ratio_)):
    if i == 0:
        cum_explained_var.append(pca.explained_variance_ratio_[i])
    else:
        cum_explained_var.append(pca.explained_variance_ratio_[i] + 
                                 cum_explained_var[i-1])

print(cum_explained_var)

输出：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章