为什么0-1损失函数(从概念上看是最明显且信息量最大的二元分类模型)在感知器或支持向量机(SVM)算法中不被使用?
回答:
对于感知器来说,大多数情况下它们是使用梯度下降法(或类似的方法)进行训练的,而0-1损失函数是平坦的,因此难以收敛(更不用说它在0处不可微分)。
SVM基于解决一个优化问题,即最大化类别之间的间隔。因此,在这种情况下,凸损失函数是更可取的,这样我们可以使用多种通用的凸优化方法。0-1损失函数不是凸的,因此用处也不大。请注意,这是由于当前技术水平所限,但如果发现了一种能够高效优化非凸函数的新方法,那么情况可能会改变。
编辑:修正 typo