应该选择多少主成分?

我知道主成分分析是对矩阵进行奇异值分解,然后生成一个特征值矩阵。为了选择主成分,我们需要只选择前几个特征值。现在,问题是我们如何决定从特征值矩阵中应该选择多少个特征值?


回答:

要决定保留多少个特征值/特征向量,你应该考虑你进行主成分分析的初衷。你是为了减少存储需求,还是为了降低分类算法的维度,或者是出于其他原因?如果你没有严格的限制,我建议你绘制特征值的累积和(假设它们是按降序排列的)。如果你在绘图前将每个值除以特征值的总和,那么你的图表将显示保留的总方差比例与特征值数量的关系。该图表将很好地指示你何时达到收益递减点(即,保留额外的特征值所获得的方差很少)。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注