这个问题是对这个问题的扩展。
简而言之:我正在尝试使用我自己的数据集来训练TS对象检测API。为了概念验证,我决定使我的数据集符合Pascal VOC 2012基准。
目前,我正在尝试从我的Pascal VOC注释中创建一个TFRecord文件。
查看他们在create_pascal_tf_record.py脚本中的这一行,他们只是获取了飞机的描述符;由于没有更好的词,我称之为文本文件。为什么会这样呢?其他类别的描述符呢?
旁注
这个文件;名为aeroplane_train.txt,是与Pascal VOC 2012数据集一起包含在VOC2012/ImageSets/Main/中的。
看一下这个文件,我们可以看到第一列代表图像名称,-1或1表示该特定图像是否包含我们感兴趣的类别(飞机)。
aeroplane_train.txt文件的部分内容如下:
2008_000008 -12008_000015 -12008_000019 -12008_000023 -12008_000028 -12008_000033 12008_000036 -12008_000037 12008_000041 -12008_000045 -12008_000053 -12008_000060 -12008_000066 -12008_000070 -12008_000074 -12008_000085 -12008_000089 -12008_000093 -12008_000095 -12008_000096 -12008_000097 -12008_000099 -12008_000103 -12008_000105 -12008_000109 -12008_000112 -12008_000128 -12008_000131 -12008_000132 -12008_000141 -1
回答:
我回答了一个类似的问题在这里。重点是我们目前只查看aeroplane_train.txt文件的第一列(这与其他xxx_train.txt文件相同),这让我们能够找出训练集中每张图像的路径。