我有一个高维度(600维)的数据集,并且只有一个类别的小样本量(大约100个数据点)。数据的特性使得生成异常值非常困难,因此我需要在这些数据上训练一个单类分类器。
你有单类分类方面的经验吗?对于小样本量和高维度数据,最好的算法是什么?我在考虑使用libsvm库中的单类SVM,这是不是一个好的选择?
感谢建议
回答:
如果你想走神经网络的路线,那么:
对于高维度的单类分类,你可能需要采用类似于大海捞针式的训练方法。
我认为其中最值得注意的是自适应梯度方法。
否则,SVM在处理高维度数据方面非常高效,而且由于不太可能出现异常值,这进一步加强了使用基于边界的算法的理由。