我有一个机器学习问题,输入是高维的标记数据,样本量相对较小。通过使用非常棒的可视化指南,我选择了svm_c_linear_trainer
方法。但从文档中我了解到,类似的svm_c_linear_dcd_trainer
有“热启动”的选项,这听起来比“冷启动”更好,例如在交叉验证循环中。然而,svm_c_linear_dcd_trainer
是为不同类型的问题选择的方法,主要区别在于应用于未标记数据的情况。
使用svm_c_linear_dcd_trainer
处理标记数据会有什么问题吗,或者有其他什么好的理由说明svm_c_linear_trainer
更好?
回答:
这篇关于双下降SVM的文章以及DLib网站上的文档显示,svm_c_linear_dcd_trainer
可以作为标准线性SVM的直接替代品。
据称其性能更为优越(引用自上述文章):
实验表明,我们的方法比现有最先进的实现更快。
…因为该算法据说在优化利用上做得更好,同时给出的结果与标准SVM算法相同。
文章的第6页和第7页对比了不同数据集上的其他算法,可能会对你特别有帮助。