在观看了以下精彩视频后:https://www.youtube.com/watch?v=LxfUGhug-iQ,我对如何应用滤波器以及不同CNN的架构有了很好的理解。我还观看了其他一些视频并阅读了论文,但我的理解仍然不够深入,希望有人能帮助我更好地理解这些内容。
我们学习了在图像上滑动滤波器的不同方法。现在,这个获取点积的过程,是用于训练CNN还是用于已训练滤波器的识别?还是在训练和识别中都使用?
在上面的图像中,那些滤波器是否已经训练过了?我理解白色代表滤波器的激活,但最后一列是否应该向我传达一些信息?
如果图像中有5个结果如图所示,是否某些滤波器(行)是专门设计来检测图像的某些属性的?(例如,第2个滤波器寻找轮胎,第3个滤波器寻找车头灯,第4个滤波器表示马蹄)。所以例如,上面的图像有轮胎和车头灯,所以这两个滤波器的映射很强?
回答:
因此,回答你的问题如下:
- 点积在训练和识别阶段都使用。在每次使用卷积网络时,计算点积是核心操作——它是计算网络内部和最终值的必需步骤。
- 该图像展示了在计算与图像的某些部分或前一层输出的点积后,不同滤波器的激活情况。它们被转换为灰度图像并打印出来,以显示训练阶段后每个滤波器的用途。请注意,每经过一层,图像的分辨率都会比前一层低,并且更难理解它们可能编码的内容。它们只是显示每个滤波器在哪里被激活——具体激活什么取决于我们的解释。
- 在该图像中,你可以看到网络末端的FC层。这意味着在卷积阶段之后,计算会在全连接层中进行,这些层被设计来学习和识别滤波器中对分类阶段有帮助的特定模式。可以把这部分看作是一个专家,他观察哪些滤波器被激活(以及在哪里),并决定图像的类别。