Home IT技术首次训练周期后的过拟合

首次训练周期后的过拟合

IT技术 xiaolong · 2025年4月12日 · 0 Comment

我在进行面部表情识别（55个受试者）时使用了卷积神经网络（通过Keras）。我的数据集相当困难，约有45万条数据，分为7个类别。我已经按照受试者和类别标签平衡了训练集。

我实现了一个非常简单的CNN架构（带有实时数据增强）：

model = Sequential()model.add(Convolution2D(32, 3, 3, border_mode=borderMode, init=initialization,  input_shape=(48, 48, 3)))model.add(BatchNormalization())model.add(PReLU())model.add(MaxPooling2D(pool_size=(2, 2)))model.add(Flatten())model.add(Dense(256))model.add(BatchNormalization())model.add(PReLU())model.add(Dropout(0.5))model.add(Dense(nb_output))model.add(Activation('softmax'))

在第一个训练周期后，我的训练损失持续下降，而验证损失却在上升。过拟合会这么快就发生吗？还是我的数据本身存在混淆的问题？我是否也应该平衡测试集？

回答：

可能是这个任务比较容易解决，经过一个训练周期后，模型已经学会了足够的知识来解决它，继续训练更多周期只会增加过拟合的风险。

但是，如果你只平衡了训练集而没有平衡测试集，可能发生的情况是你是在训练一个任务（在均匀分布的数据上进行表情识别），然后在测试时却面对一个略有不同的任务，因为测试集没有平衡。

computer-vision conv-neural-network deep-learning machine-learning neural-network

发表回复取消回复