在主成分分析中
我想知道为什么数据投影到主成分上,其方差是由对应于主特征向量的特征值给出的?
我在教科书中找不到这个解释。
回答:
在主成分分析(PCA)中,你是在计算原始坐标系的旋转,使得新协方差矩阵的所有非对角元素变为零(即,新坐标是不相关的)。特征向量定义了新坐标轴的方向,而特征值对应于新协方差矩阵的对角元素(沿新轴的方差)。因此,特征值按定义决定了沿相应特征向量的方差。
请注意,如果你将所有原始数据值乘以某个大于1的常数,这将导致数据的方差(和协方差)增加。如果你随后对修改后的数据进行PCA,你计算出的特征向量将是相同的(你仍然需要相同的旋转来使你的坐标不相关),但特征值会增加,因为沿新坐标轴的数据方差会增加。