scikitlearn PCA方法中百分比值的解释

2条回答

网友

1楼 · 编辑于 2024-06-28 20:50:48

你会触及一个更为普遍的观点，尽管在实践中经常使用，但很少有人明确提及，甚至在教程和介绍性说明中也没有。虽然我从来没有想过这样的问题，但从初学者的角度来看，这是完全有道理的（初学者通常不受某些惯例的约束，经验丰富的实践者认为这是理所当然的，而且往往他们甚至没有注意到这些惯例……）。在

通常，当我们选择主成分的数量时（例如，用于降维、可视化等），我们选择一个数字k，它隐含的意思是“从PC1开始，按顺序继续，直到（并包括）PCk”。这就是R中caret包的^{}函数背后的原理（也可以说是在任何软件包中执行类似任务的所有函数的后面）。在

换言之，至少据我所知，在你所描述的这种情况下，我们从不通过“切利采摘”来选择PC（例如，以PC2、PC4和PC5为例）。相反，我们总是选择一个k < n（这里是n=5），然后我们继续获取所有第一个k的PC，即从PC1开始。在

网友

2楼 · 编辑于 2024-06-28 20:50:48

documentation说明了0 < n_components < 1的情况：

if 0 < n_components < 1 and svd_solver == 'full',
select the number of components such that the amount of variance that needs to be explained is greater than the percentage specified by n_components.

如果你提到这样的话，你会更清楚：

if 0 < n_components < 1 and svd_solver == 'full',
select the minimum number of components from the sorted list (descending order) according to their respective explained variance values such that the amount of variance that needs to be explained is greater than the percentage specified by n_components

这样就不会有歧义了。在

之后：

PCA(0.71)将返回PC1和PC2

PCA(0.005)-（不太可能的情况）将返回PC1

相关问题更多 >

编程相关推荐

热门问题

热门文章