我刚开始学习神经网络,从Martin Gorner的一段视频中了解了这个主题的基本介绍(https://youtu.be/vq2nnJ4g6N0),大约在5:23(https://youtu.be/vq2nnJ4g6N0?t=3230)时,他提到图像将从28×28展平为1×784。这个步骤为什么是必要的?是因为要与X相乘(叉积)的权重(W)将是一个相同长度的单行向量吗?是为了叉积的需要,还是有其他原因?提前谢谢!
回答:
并不是那样的。目的纯粹是为了让新手更容易理解。向你展示的全连接神经网络是基础构建块。之后你会学到更高级的模式。
图像包含空间结构,因此更适合使用能够识别结构的架构,例如卷积神经网络(1, 2)。事实上,如果你继续观看讲座,你会发现正是如此。