包含五列的数据
one | two | three | four | five
但我想要这样的结果
pca 1 | pca 2 | five
是否可以只选择4列进行PCA?
回答:
用PCA减少一些特征在数学上是没有问题的。PCA特征是那个子空间的线性组合(旋转轴),其他(正交)的特征保持不变。
我提供了一个在x,y,z上的多元高斯分布的例子。我对x
和y
使用PCA,保持z
不变。你可以检查这些图表来确认第二组点确实与第一组相同,只是x,y
上进行了旋转:
# 在x-y平面拟合pca,保持z不变pca = PCA(n_components=2)pca.fit(X[:, 0:2])# 获取“旋转后的”pca分量 x', y'q = pca.transform(X[:,0:2])xp, yp = q[:,0], q[:,1]px.scatter_3d(x=xp, y=yp, z=z, labels={"x":"x'", "y":"y'", "z":"z"}).show()|