对于卷积神经网络的直观理解是否正确:1. 卷积基本上是匹配图像的局部部分与卷积核/滤波器的相似程度。2. 卷积核/滤波器就像一个特征检测器。重要的是它是学习得来的,并通过随机梯度下降(SGD)自动改变和优化。
回答:
这种理解在非常粗略的“相似程度”上是正确的。如果你认为点积的计算是测量相似性,那么答案是肯定的。为什么我个人对此有疑虑?因为这在很大程度上取决于向量(或矩阵)的范数。让我们考虑以下图像
1 1 12 2 21 1 1
和卷积核
1 1 12 2 21 1 1
我们对它们进行卷积并得到
1 + 1 + 1 + 2*2 + 2*2 + 2*2 + 1 + 1 + 1 = 18
现在让我们考虑另一张图像
2 2 22 2 22 2 2
我们得到
2 + 2 + 2 + 2*2 + 2*2 + 2*2 + 2 + 2 + 2 = 24
我认为第一张图像与卷积核的相似度更高,但卷积结果却显示出不同的结果。因此,这并不那么简单,卷积只是图像的基本线性过滤,通过对信号进行卷积,应用点积到子样本,但称之为“相似性搜索”有点过头了。然而,它确实是一个特征检测器,一个非常特定的检测器。
关于卷积的关键点,你在描述中遗漏了这些检测器的共享性质这一事实,你学习了一组局部图像滤波器,这些滤波器被应用到图像的每一个“点”,从而实现了一种位置不变性,并显著减少了模型的参数化。