应该选择多少主成分?

我知道主成分分析是对矩阵进行奇异值分解,然后生成一个特征值矩阵。为了选择主成分,我们需要只选择前几个特征值。现在,问题是我们如何决定从特征值矩阵中应该选择多少个特征值?


回答:

要决定保留多少个特征值/特征向量,你应该考虑你进行主成分分析的初衷。你是为了减少存储需求,还是为了降低分类算法的维度,或者是出于其他原因?如果你没有严格的限制,我建议你绘制特征值的累积和(假设它们是按降序排列的)。如果你在绘图前将每个值除以特征值的总和,那么你的图表将显示保留的总方差比例与特征值数量的关系。该图表将很好地指示你何时达到收益递减点(即,保留额外的特征值所获得的方差很少)。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注