我原本以为用于训练SVM
的training data
是由图像特征组成的,但在再次阅读这篇文章后,发现示例中给SVM
的training_mat
只是将img_mat
展平到一维的矩阵。
所以我的问题是,在训练SVM
时,是直接给它整张图像,一行一行地输入,还是需要检测
和提取
特征,然后将这些特征的Mat
展平到一维?
回答:
你可以提取特征,也可以使用像素强度值作为特征。在这个例子中,他们采用了后者。这样做会得到非常多的特征,其中许多可能并不有用。这使得SVM训练的收敛变得更加困难,但仍然是可能的。根据我的个人经验,如果你提取较少数量的“优质”特征来最好地描述你的数据,SVM的表现会更好。然而,近年来,已经证明最先进的估计器,如深度神经网络(当用作SVM的替代品时),仅使用像素强度值作为特征也能表现得非常好。这消除了在那些在公共数据集(如ImageNet)上取得最先进结果的方法中进行特征提取的需要。