我正在尝试使用CNN GoogleNet Inception训练图像分类器。我有一些标记的图像(每个类别大约1000张)和更多未标记的图像。到目前为止,我只使用了标记的图像,并且获得了不错的准确率。我只是不确定是否可以以某种方式使用未标记的图像。
关于这些未标记的图像,唯一的信息是,每个目录中总是有一些图像(1到10张),并且同一目录中的图像属于同一个类别。
谢谢您
回答:
可以看看Keras ImageDataGenerator。这是一个方便的函数,可以从对应于类别的子目录中读取图像。
即使你不使用Keras进行训练,你也可以进行一次模拟运行,为你的未标记图像生成标签,然后在你的神经网络架构中使用这些标签。
你还可以研究一下伪标记方法,对于那些你没有任何内容信息的图像。