为Tensorflow对象检测API创建PASCAL Voc数据集

这个问题是对这个问题的扩展

简而言之:我正在尝试使用我自己的数据集来训练TS对象检测API。为了概念验证,我决定使我的数据集符合Pascal VOC 2012基准。

目前,我正在尝试从我的Pascal VOC注释中创建一个TFRecord文件。

查看他们在create_pascal_tf_record.py脚本中的这一行,他们只是获取了飞机的描述符;由于没有更好的词,我称之为文本文件。为什么会这样呢?其他类别的描述符呢?

旁注

这个文件;名为aeroplane_train.txt,是与Pascal VOC 2012数据集一起包含在VOC2012/ImageSets/Main/中的。

看一下这个文件,我们可以看到第一列代表图像名称,-1或1表示该特定图像是否包含我们感兴趣的类别(飞机)。

aeroplane_train.txt文件的部分内容如下:

2008_000008 -12008_000015 -12008_000019 -12008_000023 -12008_000028 -12008_000033  12008_000036 -12008_000037  12008_000041 -12008_000045 -12008_000053 -12008_000060 -12008_000066 -12008_000070 -12008_000074 -12008_000085 -12008_000089 -12008_000093 -12008_000095 -12008_000096 -12008_000097 -12008_000099 -12008_000103 -12008_000105 -12008_000109 -12008_000112 -12008_000128 -12008_000131 -12008_000132 -12008_000141 -1

回答:

我回答了一个类似的问题在这里。重点是我们目前只查看aeroplane_train.txt文件的第一列(这与其他xxx_train.txt文件相同),这让我们能够找出训练集中每张图像的路径。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注