我一直在阅读一篇关于稀疏主成分分析(Sparse PCA)的论文,链接如下:http://stats.stanford.edu/~imj/WEBLIST/AsYetUnpub/sparse.pdf
论文中提到,如果你有n
个数据点,每个数据点由p
个特征表示,那么PCA的复杂度是O(min(p^3,n^3))
。
能有人解释一下这是为什么吗?
回答:
协方差矩阵的计算复杂度是O(p2n);其特征值分解的复杂度是O(p3)。因此,PCA的复杂度是O(p2n+p3)。
O(min(p3,n3))意味着你可以以固定时间分析任意大小的二维数据集,这显然是不正确的。