我在阅读这篇论文理解深度学习需要重新思考泛化,但我不明白为什么在第5页,2.2节“影响”下的“Redemacher复杂度”部分提到界限是平凡的?
由于我们的随机化测试表明,许多神经网络可以完美地拟合带有随机标签的训练集,我们预期对于相应的模型类H,Rad(H)=1。当然,这是一个对Rademacher复杂度的平凡上界,在现实环境中并不会导致有用的泛化界限。
显然,我在Radmacher方面缺乏一些知识,因为我不明白他们是如何得出这个结论的。如果有人能向我解释,我将不胜感激。
回答:
在论文中,函数h
被限定在1以内,因此Rademacher复杂度被平凡地限定在1(你将n
个等于1的项相加,然后除以n
)。