网络手术：如何重塑caffe模型文件中的卷积层？

我正在尝试重塑caffe模型文件中卷积层的大小（这是这个问题的后续问题）。虽然有一个关于如何进行网络手术的教程，但它只展示了如何将权重参数从一个caffe模型复制到另一个相同大小的模型。
而我需要在我的卷积滤波器中添加一个新的通道（全部为0），以便将其大小从当前的（64x3x3x3）更改为（64x4x3x3）。

假设卷积层被称为'conv1'。这是我目前尝试过的方法：

# 加载原始网络并提取全连接层的参数net = caffe.Net('../models/train.prototxt',                 '../models/train.caffemodel',                 caffe.TRAIN)

现在我可以执行以下操作：

net.blobs['conv1'].reshape(64,4,3,3);net.save('myNewTrainModel.caffemodel');

但保存的模型似乎没有改变。我读到卷积的实际权重存储在net.params['conv1'][0].data中，而不是net.blobs中，但我无法弄清楚如何重塑net.params对象。有人有想法吗？

回答：

正如你所指出的，net.blobs不存储学习的参数/权重，而是存储将滤波器/激活应用于网络输入的结果。学习的权重存储在net.params中。（更多详情见这里）。

据我所知，你不能直接reshapenet.params并添加一个通道。
你可以做的，是有两个网络deploy_trained_net_with_3ch.prototxt和deploy_empty_net_with_4ch.prototxt。这两个文件除了输入形状定义和第一层的名称外，可以几乎相同。
然后你可以将两个网络加载到python中并复制相关部分：

net3ch = caffe.Net('deploy_trained_net_with_3ch.prototxt', 'train.caffemodel', caffe.TEST) net4ch = caffe.Net('deploy_empty_net_with_4ch.prototxt', 'train.caffemodel', caffe.TEST)

由于所有层名称都相同（除了conv1），net4ch.params将具有train.caffemodel的权重。至于第一层，你现在可以手动复制相关部分：

net4ch.params['conv1_4ch'][0].data[:,:3,:,:] = net3ch.params['conv1'][0].data[...]

最后：

net4ch.save('myNewTrainModel.caffemodel')

学技术

网络手术：如何重塑caffe模型文件中的卷积层？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复