什么是SVM或SVR模型?SVM模型的决定因素是什么?
之前,我认为如果你知道SVM的核类型(例如RBF核)以及确切的参数,比如SVR中的-C、-gama、-epsilon,模型就确定了。
之后,我认为模型应该与支持向量(SVs)相关,而支持向量是一些训练样本,所以模型应该由训练样本决定。这是对的吗?
如何理解SVM模型?模型依赖于什么?模型的内在是什么?谢谢!
如果你想举个例子,我更喜欢使用LIBSVM工具箱。
回答:
SVM模型是一个如下所示的分类函数
cl(x) = sgn( SUM_i y_i alpha_i K( SV_i, x ) + b )
其中
- y_i 是第i个支持向量的标签(-1或+1)
- alpha_i 是第i个支持向量的拉格朗日乘数,在优化过程中找到
- SV_i 是第i个支持向量
- K( x,y ) 是使用的核函数
- b 是截距项,在优化过程中找到
解释直接来自于其推导,如果phi(x)是一个核空间转换函数(意味着K(x,y)= < phi(x),phi(y) >),那么:
w = SUM_i y_i alpha_i phi( SV_i )
是分离超平面的法向量(垂直向量)。因此,上述分类公式只是简单地检查给定点是否位于这个超平面的一侧或另一侧。解释的核心难点在于phi(x)将点转换到可能非常复杂的空间,在RBF核的情况下,phi(x)将点转换到函数空间,这意味着每个点都变成一个函数,而你的超平面是函数空间中的超平面。这是一个有点抽象的概念,但仍然有效。