假设数据集中有8个特征。我使用PCA发现,通过累积解释方差比的前三个特征包含了99%的信息。那么,为什么我需要通过PCA来拟合和转换这三个特征,才能用它们来训练我的神经网络呢?为什么不能直接使用这三个特征呢?
回答:
原因是当PCA告诉你前三个成分解释了99%的方差时,这并不意味着它是由前三个特征解释的。PCA成分是特征的线性组合,但它们通常不是特征本身。例如,PCA成分之间必须是正交的,而特征则不必如此。
假设数据集中有8个特征。我使用PCA发现,通过累积解释方差比的前三个特征包含了99%的信息。那么,为什么我需要通过PCA来拟合和转换这三个特征,才能用它们来训练我的神经网络呢?为什么不能直接使用这三个特征呢?
回答:
原因是当PCA告诉你前三个成分解释了99%的方差时,这并不意味着它是由前三个特征解释的。PCA成分是特征的线性组合,但它们通常不是特征本身。例如,PCA成分之间必须是正交的,而特征则不必如此。