我正在使用带有Python的Caffe网络。我有一个像这样的train.txt文件:
train/1175-c/b0a1.bmp b0a1 train/1175-c/b0a2.bmp b0a2 train/1175-c/b0a3.bmp b0a3 train/1175-c/b0a4.bmp b0a4 train/1175-c/b0a5.bmp b0a5 train/1175-c/b0a6.bmp b0a6 train/1175-c/b0a7.bmp b0a7 train/1175-c/b0a8.bmp b0a8 train/1175-c/b0a9.bmp b0a9 train/1175-c/b0aa.bmp b0aa
我的问题是:
-
我可以在每行的结尾使用十六进制而不是整数吗?
-
关于标签,它需要从0开始吗?
或者我应该将上述内容改为:
train/1175-c/b0a1.bmp 45217train/1175-c/b0a2.bmp 45218train/1175-c/b0a3.bmp 45219train/1175-c/b0a4.bmp 45220train/1175-c/b0a5.bmp 45221train/1175-c/b0a6.bmp 45222train/1175-c/b0a7.bmp 45223train/1175-c/b0a8.bmp 45224train/1175-c/b0a9.bmp 45225train/1175-c/b0aa.bmp 45226
回答:
如果您将此train.txt
列表用作convert_imageset
的输入或作为"ImageData"
层的source
,那么每行的第二部分必须是数字标签。
标签必须从0开始,因为它们在计算损失和准确性时被用作预测概率向量的索引。有关更多信息,请参见这个讨论。