我使用了预训练的GoogLeNet模型,并在我的数据集上针对二分类问题进行了微调。验证数据集的"loss3/top1"
准确率达到了98.5%。但是在我的评估数据集上评估性能时,准确率只有50%。无论我在train_val.prototxt中做了什么更改,我也在deploy.prototxt中做了相同的更改,我不确定在这些行中应该做哪些更改。
name: "GoogleNet"layer { name: "data" type: "input" top: "data" input_param { shape: { dim:10 dim:3 dim:224 dim:224 } }}
有什么建议吗?
回答:
您不需要在deploy.prototxt
中进一步更改任何内容,而是需要更改您向网络输入数据的方式。您必须以与训练/验证图像相同的方式转换您的评估图像。
例如,查看classifier.py
是如何通过正确初始化的caffe.io.Transformer
类处理输入图像的。
您在prototxt中的"Input"
层只是一个声明,让caffe根据形状为10-by-3-by-224-by-224的输入blob分配内存。
* 当然,您必须验证train_val.prototxt
和deploy.prototxt
完全相同(除了输入层和损失层之外):这包括确保层名称相同,因为caffe使用层名称从’caffemodel’文件中分配权重到实际加载的参数。不匹配的名称会导致caffe对某些层使用随机权重。