我在使用FER-2013数据集进行面部表情识别,得到的验证准确率为67.317%,测试准确率为68.960%。这样的结果是否正确?
回答:
理论上,测试准确率高于验证准确率是可能的。
让我们假设我们有以下数据点:
X Y1 0 12 1 23 2 14 3 25 4 06 5 2
我们想要构建一个线性回归模型(对于像面部识别这样的分类问题也是如此)。假设我们使用点1-4进行训练,点5用于验证,点6用于测试。这只是一个简化的例子。
通过使用点1-4进行训练,我们的回归方程将是:
ŷ = 0.2X + 1.2
现在,让我们计算MSE(对于分类问题中的准确率,它是等价的)。
验证误差:(0.2*4+1.2 -0)^2 = 7.84
测试误差:(0.2*5+1.2-2)^2 = 1.44
如你所见,验证误差高于测试误差。
但这个例子只是理论上的。一般来说,测试误差高于验证误差。为什么呢?
你使用验证集来调整超参数。因此,通过调整超参数,验证误差会降低,并变得低于你的测试误差,因为你没有为测试集调整超参数。
因此,如果你的验证集的准确率低于测试集的准确率,可能是因为你没有正确地调整模型的超参数。