在模式识别中,为什么特征提取如此重要?为什么我们必须减少特征空间?这仅仅是一个计算问题,还是这个过程能提高分类器的泛化能力?
回答:
特征提取不仅仅是关于计算复杂度的问题。对于固定的训练样本数量,如果特征的数量变得足够大,分类器的性能可能会显著下降。参见维度灾难。
作为一个实际案例,考虑使用多元正态统计(均值和协方差)的分类器。对于N
个训练样本和k
个特征,当N < k
时,协方差矩阵将变得奇异。因此,如果无法增加样本数量,就有必要减少特征的数量以便使用分类器。
在模式识别中,为什么特征提取如此重要?为什么我们必须减少特征空间?这仅仅是一个计算问题,还是这个过程能提高分类器的泛化能力?
回答:
特征提取不仅仅是关于计算复杂度的问题。对于固定的训练样本数量,如果特征的数量变得足够大,分类器的性能可能会显著下降。参见维度灾难。
作为一个实际案例,考虑使用多元正态统计(均值和协方差)的分类器。对于N
个训练样本和k
个特征,当N < k
时,协方差矩阵将变得奇异。因此,如果无法增加样本数量,就有必要减少特征的数量以便使用分类器。