我看到很多示例展示了如何在Caffe中插入图像数据进行模型训练。
我正在尝试使用非图像数据来训练模型。我可以将其重塑为矩阵或向量(对于每个示例),但我不明白如何让我的Caffe网络读取这些数据。
我知道Caffe可以使用lmdb/hdf5数据库,并且我还可以使用Python数据层。我猜Python数据层将是我的最佳选择。能有人提供一个示例,展示如何在Python中创建某种数组并将其用作Caffe模型的训练数据吗?
回答:
对于简单的向量输入,您不需要创建Python层。HDF5层可能是最容易操作的。只需使用您喜欢的工具创建HDF5文件(参考这个来使用matlab创建HDF5,或者参考这个来使用python创建)。
这两个示例都相当容易理解。matlab示例为您提供了HDF5文件创建的更高级版本——例如创建批次等——但其核心您只需调用
store2hdf5(filename, data, labels) %其他参数是可选的
同样,python示例也展示了完整的示例,您可能需要也可能不需要全部。创建HDF5文件的核心非常简单。
import h5pywith h5py.File('filename.h5', 'w') as f: f['data'] = your_data f['label'] = your_labels
您可以轻松地在HDF5数据层中使用这样创建的文件,方法如下。您只需创建一个文本文件,列出您想要使用的HDF5文件列表。
layer {name: "data"type: "HDF5Data"top: "data"top: "label"include {phase: TRAIN}hdf5_data_param {source: "path_to_text_file_containing_list_of_HDF5_Files.txt" #batch_size: 128shuffle: true}}