我目前正在阅读Nello Cristianini的《支持向量机及其他基于核的方法导论》一书。我无法理解他在第2章和第3章第3.2节“隐式映射到特征空间”中讨论的线性学习机的对偶表示的概念。我不知道这种对偶表示是否是一个通用概念,还是仅限于这本书的命名惯例。因此,我特意引用了这本书和相关章节,希望有人已经读过。如果这是一个通用概念,我希望有人能解释线性学习机的对偶表示是什么意思,以及这种对偶表示的优势是什么?
我希望这个问题不会太模糊,但遗憾的是,我没有足够的背景知识或对这些概念的理解来进一步阐述我的疑问。
任何帮助都将不胜感激。
回答:
这是一个通用概念,并不特定于这本书。
对偶问题的主要好处是数据点只出现在点积内。每对数据点的点积通常表示在核矩阵中。如果你使用不同类型的核,你会得到不同类型的分类器(点积:线性,rbf:rbf网络等)。这被称为核技巧(或者像你读的书中所称的隐式映射到特征空间),这是过去十年机器学习中最重要的突破之一。
不过,并非所有东西都可以作为核。核矩阵需要是正半定的。维基百科上有一篇关于核技巧的很棒的文章。此外,不仅L2正则化的二元分类器(SVM)可以被核化,还有核感知器、核主成分分析、核化的一切。