我正在使用Tensorflow构建一些对象检测器,非常享受这个过程。
在我参与的任何项目中,最耗时的部分是收集图像并在我想检测的相关类别周围绘制边界框。
为了获得好的结果,我需要为每个类别标记至少100张图像——通常更多。当类别有很大变化时——例如“人”分类器——你需要更多得多。
这引出了我的问题,很多著名的基础网络——MobileNet、VGG-Net、LeNet等——预先在几百个不同类别上训练。因此,它们应该在某个地方存储了预标记/标记的图像。
这些对普通开发者来说有任何可用的吗?
我找到了一些——例如来自这里,但它们似乎不包含允许我生成TFRecords来训练对象检测器的标签。
简而言之 – 假设我只想创建一个“人”分类器——我在哪里可以找到标记的训练数据,以便快速创建用于生成TFRecords/在Tensorflow中创建对象检测器的类别?
回答:
实际上,您可以通过转移学习或在您自己的数据集上对它们进行微调来充分利用预训练网络,这将节省大量计算时间和资源。
但如果您坚持从头开始训练,有一些著名的图像数据集,如OpenImages、COCO、Kitti等。
这些数据集包含除“人”之外的更多类别,但您可以在创建tfrecord时过滤掉它们,因此您的tfrecord只包含关于“人”的边界框信息。