假设有两个感知器在同一个线性可分分布的无限样本上运行。它们会收敛到相同的决策函数吗?它们会收敛到相同的权重向量 w 吗?我是机器学习的初学者,所以如果有人能提供详细的解释就太好了。
回答:
如果学习率足够小,它们会收敛到相同的决策边界。但是,根据两个感知器的初始权重(假设它们是分别随机化的),两个感知器的最终权重可能会不同。请注意,与输入相关的权重是分离平面的系数,这些系数不是唯一的(例如,如果你将与一个平面相关的系数翻倍,平面的位置不会改变)。因此,两个感知器的极限权重不相等是完全可能的(而且很可能)。