对于在准确率图中表现出局部最小值的深度神经网络,您会给出什么建议来提高其准确率?
回答:
您观察到的现象是模型在训练过程中准确率的波动,这是因为您是针对每个小批量计算梯度。这些梯度旨在近似整个训练集的梯度,但它们并不总是准确的,因此有时您会看到准确率下降。
一些波动也可能是由于您的损失函数与准确率指标不完全相关造成的。
“局部最小值”这个术语通常用来描述损失函数的局部最小值与其全局最小值不同的情况。我不会在这里用它来描述准确率图的波动,因为这可能会引起混淆。毕竟,您是在试图最大化准确率。