使用Python层处理Caffe标签数据时将其作为int类型

我正在尝试使用Python层创建标签数据。具体来说,我有一个包含Caffe数据的LMDB数据库,其中标签由6个使用位掩码的标签组成,我需要提取其中的一个来进行学习。

但是,当传递到MyPythonLayer.forward方法时,标签字段显示为np.float32类型,并且经过四舍五入后,转换回整数的值与原始值不同。自然,这使得使用位掩码提取其中的部分变得毫无意义。有什么方法可以强制Caffe将标签数据作为整数传递给MyPythonLayer.forward吗?

MyNet.prototxt:

layer {  name: "data"  type: "Data"  top: "data"  top: "label"  include {    phase: TRAIN  }  transform_param {    scale: 1  }  data_param {    source: "SUMTH.../train_lmdb"    batch_size: 3400    backend: LMDB  }}...layer {  name: 'convert_compose_label_py'  type: 'Python'  bottom: 'label'  top: 'extracted_label'  python_param {    module: 'convert_compose_label'    layer: 'ComposeLabelToSingleLabel'    param_str: '1'  }}layer {  name: "loss"  type: "SoftmaxWithLoss"  bottom: "ip2"  bottom: "extracted_label"  top: "loss"}

模块convert_compose_label.py:

class ComposeLabelToSingleLabel(caffe.Layer):  ...  def forward(self, bottom, top):    batch_size = bottom[0].data.shape[0]    out_file1 = open(self.log_file1, 'a')    for i in range(batch_size):        out_file1.write("%d\n" % bottom[0].data[i]) # 结果与LMDB中的标签值在最低1-2位数字上有所不同        single_label = (compose_label.astype(np.int32) >> self.shift) & self.kLabelMask # 如果不使用astype(np.int32),会产生错误,指出>>不能与np.float32一起使用。         top[0].data[i]=single_label # 显然,当self.shift==0时,结果是不正确的        ...

回答:

不可以。

为什么?

Caffe将标签存储在Datum中作为int类型,但当它读取Datum并将其“分解”为"data""label" blobs时,值会被转换为float32,因为Blob的数据类型(默认情况下)是float32

如果你需要多标签输入到Caffe中,你可以使用"HDF5Data"层(这更灵活),或者使用"Python"层。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注