我正在尝试使用Python层创建标签数据。具体来说,我有一个包含Caffe数据的LMDB数据库,其中标签由6个使用位掩码的标签组成,我需要提取其中的一个来进行学习。
但是,当传递到MyPythonLayer.forward方法时,标签字段显示为np.float32类型,并且经过四舍五入后,转换回整数的值与原始值不同。自然,这使得使用位掩码提取其中的部分变得毫无意义。有什么方法可以强制Caffe将标签数据作为整数传递给MyPythonLayer.forward吗?
MyNet.prototxt:
layer { name: "data" type: "Data" top: "data" top: "label" include { phase: TRAIN } transform_param { scale: 1 } data_param { source: "SUMTH.../train_lmdb" batch_size: 3400 backend: LMDB }}...layer { name: 'convert_compose_label_py' type: 'Python' bottom: 'label' top: 'extracted_label' python_param { module: 'convert_compose_label' layer: 'ComposeLabelToSingleLabel' param_str: '1' }}layer { name: "loss" type: "SoftmaxWithLoss" bottom: "ip2" bottom: "extracted_label" top: "loss"}
模块convert_compose_label.py:
class ComposeLabelToSingleLabel(caffe.Layer): ... def forward(self, bottom, top): batch_size = bottom[0].data.shape[0] out_file1 = open(self.log_file1, 'a') for i in range(batch_size): out_file1.write("%d\n" % bottom[0].data[i]) # 结果与LMDB中的标签值在最低1-2位数字上有所不同 single_label = (compose_label.astype(np.int32) >> self.shift) & self.kLabelMask # 如果不使用astype(np.int32),会产生错误,指出>>不能与np.float32一起使用。 top[0].data[i]=single_label # 显然,当self.shift==0时,结果是不正确的 ...
回答:
不可以。
为什么?
Caffe将标签存储在Datum
中作为int
类型,但当它读取Datum
并将其“分解”为"data"
和"label"
blobs时,值会被转换为float32
,因为Blob
的数据类型(默认情况下)是float32
。
如果你需要多标签输入到Caffe中,你可以使用"HDF5Data"
层(这更灵活),或者使用"Python"
层。