帮助我理解二元SVM中的线性可分性

我将这个问题从math.stackexchange.com转发过来，因为我没有得到任何反馈，而这个问题对我来说时间紧迫。

我的问题与支持向量机中超平面的线性可分性有关。

根据维基百科的说法：

…正式地讲，支持向量机在高维或无限维空间中构建一个超平面或一组超平面，这些超平面可以用于分类、回归或其他任务。从直观上讲，通过具有最大距离的超平面（所谓的功能边界）来实现良好的分离，因为一般来说，边界越大，分类器的泛化误差就越低。

超平面对类别的线性分离对我来说直观上是可以理解的。我认为我理解了二维几何中的线性可分性。然而，当我使用一个流行的SVM库（libSVM）来实现SVM时，在摆弄数字时，我无法理解SVM如何在类别之间创建曲线，或者当类别2的点包围时，如何将类别1的中心点用圆形曲线包围起来，如果在n维空间V中的超平面是一个“平坦”的n-1维子集，或者在二维空间中 – 是一条1D线。

这就是我的意思：

二维二元SVM的圆形包围类别分离

那不是超平面。那是圆形的。这怎么运作的？还是SVM内部有比二维输入特征更多的维度？

这个示例应用可以从这里下载。

编辑：

感谢你们的全面回答。所以SVM可以通过使用核函数很好地分离奇怪的数据。在将数据发送到SVM之前线性化数据会有所帮助吗？例如，我的输入特征之一（一个数值）有一个转折点（例如0），它整齐地适合于类别1，但在零以上和零以下适合于类别2。现在，因为我知道这一点，将这个特征的绝对值发送给SVM会帮助分类吗？

回答：

正如mokus所解释的，支持向量机使用核函数将数据隐式映射到一个特征空间，在那里它们是线性可分的：

SVM将一个特征空间映射到另一个

不同的核函数用于各种类型的数据。请注意，图中的变换增加了一个额外的维度（特征），尽管这个特征从未在内存中实现。

（插图来自Chris Thornton, U. Sussex。）

学技术

帮助我理解二元SVM中的线性可分性

这就是我的意思：

编辑：

发表回复取消回复

这就是我的意思：

编辑：

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复