我是深度学习领域的新手,我想澄清一下我在首次深度学习代码,即MNIST示例中遇到的问题。顺便说一下,我可能完全错了,所以请大家手下留情 🙂
我已经将训练数据分成了批次,每批次大小为50,最大训练轮次设为15(或者直到验证损失变量开始增加)。
我在第一个训练轮次就得到了93%的准确率,这怎么可能呢?据我所知,在第一个训练轮次中,模型只对完整的训练集进行了一次前向和反向传播,所以训练集的权重和偏置只调整了一次?
我原以为在多次训练轮次之后才能得到较高的准确率,而不是在权重首次调整时就达到。
回答:
是的……在第一个训练轮次也能获得不错的准确率。这更多地取决于数据的复杂性和你构建的模型。有时候,如果学习率过高,也可能会导致训练准确率较高。
关于调整权重和偏置的部分,可能是在进行小批量训练,每个小批量都会更新模型的权重。因此,权重可能已经更新了多次,更新次数等于训练数据图像数除以样本大小。