我正在训练一个卷积神经网络(CNN)来将图像分类为英文字母和数字。我使用7位(1/0)向量的标签形式,其中第一个1/0表示字符是否存在,后面的6位代表每个字符。例如:[1,1,0,0,1,0,0]表示字符是“a”,[1,0,1,1,0,0,0]表示字符是“O”,等等。我对如何处理未检测到任何字符的情况感到困惑。我希望我的模型输出[0,0,0,0,0,0,0]。仅用正面例子训练时,模型会自动给出这样的输出吗?还是我需要找到负面图像并将它们添加到数据集中?而且,我应该考虑哪些负面情况,因为非字符的东西几乎是无限的。我知道这个问题并不难,但我刚开始接触深度学习,所以请理解。
回答:
你应该在数据集中加入一些负面样本。这将帮助模型理解并不是每个字符或每张图像都是英文字母。关于负面样本,你应该输入非字符的图像(如汽车…)以及非英文字母的字符图像。