我有一个非常简单的线性分类问题,需要针对坐标系中的以下三个类别进行线性分类:
类别 1:点 (0,1) (1,0)类别 2:点 (-1,0) (1,0)类别 3:点 (0,-1) (1,-1)
我手动使用了一个随机的初始权重 [ 1 0,0 1](2*2 矩阵)和一个随机的初始偏置 [1,1],通过对六个样本进行每次迭代,最终得到的分类结果是 X=-1 且 Y=-1。所以当 X 和 Y 都 >-1 时,属于类别 1;如果 X<=-1 且 Y>-1,属于类别 2;如果 X >-1 且 Y <=-1,属于类别 3。
在图上绘制这个分类结果后,我认为它存在一些问题,因为决策边界穿过了类别 2 和类别 3 中的样本。我想知道这是否是可以接受的。通过观察图像,我认为理想的分类应该是 x =-1/2 且 y=1/2,但经过计算我真的无法得到这个结果。
请与我分享您的想法,提前感谢。
回答:
我认为结果是可以接受的。除了 (1,0) 这个点被标记为类别 2 但被分类为类别 1 之外,所有点都被正确分类。问题在于,(1,0) 这个点也被标记为类别 1,所以不可能将类别 1 和类别 2 分开。
当然,该模型在测试集上评估时很可能表现非常糟糕。 如果你想要决策边界位于点之间的等距位置,你需要研究最大间隔分类器。