我尝试创建一个卷积神经网络
,用于从包含动物、车辆、建筑、树木和植物的组合的大型数据集中识别这些对象。
在训练过程中,我对网络的训练方式产生了疑问。我的疑问是,我是否可以将整个动物作为单一属性进行训练,或者是分别训练每种动物?
我的意思是,可以为狮子、老虎、大象等分别设立一个组,在测试时,如果满足任何一个子类别,我可以编程输出结果为动物。
我之所以产生这个疑问,是因为我读到过,为了高效检测,数据集中应该有正确的模式,而只有在我们使用对象的子类别进行训练时,才会有这种模式,而不是使用庞大的数据集。
我附上了一张展示样本数据集的图片(仅逻辑上正确)。我想知道是否应该使用单独的数据集还是单一的数据集。
回答:
使用单独的数据集还是单一的数据集进行训练将取决于多种因素。如果您想使用卷积神经网络将测试数据集中的图像仅分类为动物,而不进一步细分,那么应该在单一数据集上进行训练。然而,如果您计划将图像进一步细分为老虎和狮子,那么训练就需要在老虎和狮子的单独数据集上进行。
您用于训练的数据集类型将在很大程度上取决于您对测试数据集分类的要求。
此外,您必须确保在使用图像进行训练之前对其进行归一化处理。