在回归问题中,有哪些降维技术?我尝试过我所知道的唯一无监督技术,PCA和Kernel PCA(使用scikit learn库),但使用这些技术并没有看到任何改进。或许这些技术只适合分类问题?我可以尝试哪些其他技术?最好是那些在sklearn中实现的技术。
回答:
这是一个非常宽泛的问题,技术的适用性(或它们的组合),真的取决于你的具体问题。
一般来说,除了你提到的那些,还有几类降维方法。
-
或许最简单的降维形式是只使用一些特征,在这种情况下,我们实际上是在谈论特征选择(参见sklearn的模块)。
-
另一种方法是进行聚类(sklearn的),并用其组件的聚合来替换每个聚类。
-
最后,一些回归器使用l1惩罚和凸优化属性来同时选择一组特征;在sklearn中,参见lasso和弹性网。
再次强调,这是一个非常广泛的问题。甚至有关于特征选择的整本书和比赛,而特征选择是降维的一个子集。