我认为感知机学习算法对于线性可分数据的收敛迭代次数有一个上限。我试图找到一个确切的公式来计算这个迭代次数,但在维基百科上没有找到相关信息。
我在网上读到,这个数量取决于数据样本的数量,所以如果我有n个样本(比如5000个),感知机需要多少次迭代才能收敛(假设数据是线性可分的)?还是说这并不那么简单,而是取决于数据本身?
P.S. 我对机器学习非常新手,所以这是一个简单的问题。
回答:
维基百科引用了Novikoff, A. B. (1962)的证明,这是统计学习早期的结果之一。
这里给出了一个针对在线学习环境的略有不同的结果:
当||x_i|| ≤ D 对所有i成立
(直观上:训练实例的半径)并且margin >= γ
时:
- 所需的迭代次数上限为:
(D/γ)^2
。
有趣的结果:
- 收敛结果与样本数量无关!
- 收敛结果与输入维度无关!