我正在尝试使用Caffe训练一个卷积神经网络(CNN)。为了进行大量的数据增强,我按照这里的建议,使用了"Python"
层作为输入。
然而,从日志中我发现Caffe对所有数据使用的是float32
数据类型。这非常浪费,因为我处理的只是8位整数。有没有办法让Caffe使用dtype='uint8'
?
我尝试在设置顶层时对数据进行类型转换:
top[0].data[...] = someArray.astype(np.uint8, copy=False)
但这不起作用。
有什么建议吗?
回答:
据我所知,Caffe目前编译时只支持float32
或float64
。我认为lmdb
/leveldb
数据可以存储为uint8
格式,但在读取时Caffe会内部将其转换为float32
。
你的输入数据是uint8
并不意味着整个处理过程都保持这种方式,在第一个卷积/内积层,数据会与浮点数相乘,无法保证仍然是uint8
。
所以,我认为你应该接受输入层的小幅度空间浪费,并放弃转换为uint8
的想法。