我在纸上创建了我的第一个简单神经网络。它有5个输入(数据 – 从0.0到10.0的浮点数)和一个输出,没有隐藏层。例如,初始时我的权重为[0.2, 0.2, 0.15, 0.15, 0.3]。结果应该在与输入数据相同的范围内(0.0 – 10.0)。例如,当正确答案是8.5时,网络返回了8。反向传播会如何改变权重?我知道梯度下降是如何工作的,但我无法理解如何选择偏导数的参数。请帮助我。如果您需要,我可以进一步解释。如果您能推荐一些文献(如果可能的话,最好是简单的英语)。
回答:
如果你首先从1开始,然后分别继续到2和3。我相信你将能够很好地理解神经网络是如何工作的。
- Andrew Ng在Coursera上的视频,特别是第9.1讲、第9.2讲、第9.4讲和其他讲座。
- Tom Michell的机器学习书籍的第4章
- Raul Rojas的神经网络系统性介绍,第4、6和7章。这本书虽然长,但非常容易理解和跟随。同时,这是一本非常好且完整的书(作者网站上也可免费获取)。
理解单个感知器是如何学习的至关重要(这正是你所做的)。一旦你掌握了这一点,其他的就不会太难了。