我在一组大型数据集上使用了一种降维方法(讨论见:随机投影算法伪代码)。
将维度从1000降至50后,我得到了新的数据集,每个样本看起来像这样:
[ 1751. -360. -2069. …, 2694. -3295. -1764.]
现在我有点困惑,因为我不明白负的特征值代表什么。这样的负特征值是可以接受的吗?因为在降维之前,每个样本是这样的:
3, 18, 18, 18, 126 …
这是正常的还是我做错了什么?
回答:
我猜你实现了这篇论文中的算法。
由于投影矩阵中有一些负值,因此投影将正值映射到负值是可以的。所以符号的变化并不表示有错误。