这真是奇怪。我正在实现这个模型:
除了我使用ImageData blob从文本文件读取数据,batch_size: 1。只有两个标签,文本文件的组织方式如常
/home/.../pathToFile 0.../home/.../pathToFile 1
然而,Caffe只训练和测试标签0!
我使用常规工具运行Caffe。
./build/tools/caffe train --solver=solver.prototxt
当我在pycaffe中打开网络时,我第一次得到了这样的消息:
WARNING: Logging before InitGoogleLogging() is written to STDERR
并且net.blobs['label'].data
的大小现在是1,而它应该是2!
不仅如此,该标签似乎是一个浮点数而不是整数。
In: net.blobs['label'].dataOut: array([ 0.], dtype=float32)
我知道这之前是有效的,我只是搞不清楚我做错了什么,或者从哪里开始排查问题。
回答:
你的网络的输出形状取决于输入的batch_size
:如果你定义batch_size: 1
,那么你的网络每次处理一个单一的样本,因此它只读取一个label
。如果你将batch_size
更改为2,Caffe将读取两个样本,因此label
的形状将变为2。
这个“形状规则”的一个例外是损失输出:损失定义了一个标量函数,相对于这个函数计算梯度。因此,无论输入形状如何,损失输出始终是一个标量。
关于label
的数据类型:Caffe将所有变量存储在类型为float32
的“Blobs”中。