我一直在研究CNN的可视化问题,但似乎找不到我想要做的解决方案,或者至少我对所使用的方法的理解不够。很多内容都是非常新颖和前沿的,所以我可能没有完全掌握这些概念。
基本上,我想从CNN中提取一个训练得到的内核/特征,并制造出一张“优化”的图片,使得当该内核与该图片进行卷积时,可以得到最高的卷积和。
如果我没有理解错,这应该是在图像级别而不是在滤波器/内核级别上夸大了该内核的特征,而这似乎是大多数人在可视化这些滤波器时所做的。
如果我所问的还不清楚,这里有一个例子(可能不太好,但能表达我的意思)。
假设我们使用的是MNIST数据集,我创建了一个如下的CNN:
5×5的卷积层,包含10个内核/特征图
ReLU激活函数
2×2的最大池化,步长为2
全连接层 + Softmax
假设我已经完全训练了我的模型,现在我想查看它产生的10个5×5内核中的一个,并更好地了解它在寻找什么。我想制造一张新的28×28的图片,使得当它与这个5×5的内核进行卷积时,28×28卷积的总和最大化。
已经有类似的技术了吗?我感觉我看到的所有内容都涉及到“反向”或“逆向”神经网络(https://arxiv.org/pdf/1311.2901.pdf),查看特征图作为图片通过(http://kvfrans.com/visualizing-features-from-a-convolutional-neural-network/),或者只是查看内核本身(https://www.youtube.com/watch?v=AgkfIQ4IGaM)。
这是否是一个有用的观察点?我觉得这是我所见过的最接近我所请求的内容。 https://arxiv.org/pdf/1312.6034.pdf
任何见解都会是巨大的帮助,谢谢!
回答:
这被称为激活最大化,Keras甚至有一个例子在这里这里。请注意,帖子中的代码可能对于当前的Keras版本已经过时,但在Keras的示例文件夹中有更新的版本可用。