使用线性分类器最小化训练误差

我正在尝试寻找一个线性分类器，以最小化训练误差（0/1损失），特别是在数据非线性可分的情况下。我具体寻找的是一种确定权重的方法：

sign(weights' * features) = label

其中features \in {0, 1}^d，label \in {-1, 1}，权重为实数。我有N个训练实例，我希望上述方程对尽可能多的实例成立。我知道如果问题总是可分的，硬边界SVM会有效，但我还需要在不可分的情况下找到解决方案。

（这个任务听起来可能有点深奥，但请不要建议我去做其他事情而不是寻找最小训练误差的线性分类器——我所描述的确实是我想要解决的问题！）

回答：

Matlab包含一个非常易用的非线性SVM工具箱。你可以查看svmtrain和svmclassify。要选择核函数，你需要使用'kernel_function'参数，尽管默认值是'linear'，这正是你想要做的。'boxconstraint'参数允许你选择C，这是软约束的参数。

编辑

我找到了这篇论文，它描述了一种最小化0/1损失的方法。

学技术

使用线性分类器最小化训练误差

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复