我正在尝试实现一个支持向量机来深入理解其工作原理,但我在实现过程中遇到了困难。各处都解释了如何获得一个超平面,以便能够区分不同的类别。我的问题是如何将数据从输入空间I映射到特征空间Y。
例如,考虑以下数据:
date userId pc activity01/04/2010 07:12:31 RES0962 PC-3736 Connect01/04/2010 07:35:40 RES0962 PC-2588 Disconnect 01/04/2010 08:02:14 ZKH0388 PC-1021 Connect01/04/2010 08:20:17 ZKH0388 PC-3736 Disconnect
问)假设我们正在构建一个用户行为模型。我们可以提取每个用户的特征并用其进行训练,但在代码层面如何实现这一点?我对此一无所知。如果有人能解释一下,将会非常有帮助。
回答:
将数据映射到特征空间需要为每个决定输入类别的不同特征分配一个权重。获取权重取决于对项目理论基础的清晰理解。例如,你的财务价值由银行存款和投资决定。银行存款的权重可能是2,而投资的权重可能是5。因此,一个投资多而银行存款少的人可能拥有更高的净值。
现在,银行存款和投资这两个特征将分别作为坐标x和y处理,正如你希望的那样应用于每个输入数据(当然是具有两个特征的数据)。想象一下,你在知道每个数据(x, y)坐标的基础上绘制图表。然后,获取超平面将是下一个挑战。我希望这对你有帮助。祝你好运