我在训练一个神经网络机器学习模型,对如何调整超参数感到有些困惑。
我理解的训练过程如下:
- 使用一些超参数(例如隐藏层中的神经元数量)构建神经网络
- 使用训练数据更新参数
- 使用验证数据评估模型是否没有过拟合并且性能在提升
- 使用测试数据评估性能
我听说验证数据也用于调整超参数。我不明白这是如何操作的,因为你是在构建并训练模型之后才使用验证数据的。模型已经构建完成,我无法更改超参数。
假设我有4个超参数来指定神经网络的架构。我是否需要为每种超参数组合(4^4种组合)都经历整个训练和验证过程?
谢谢
回答:
基本上是的,你必须经历整个过程。交叉验证和模型/参数选择就是这样进行的,你需要多次训练(使用不同的参数),评估生成的模型(通过成本、损失、准确率或适当的指标),然后选择给出最佳结果的参数。
例如,如果你在训练一个回归模型,你可以训练10个不同的多项式模型,并使用验证数据来选择更好的模型。在你的情况下也是如此,但你是在尝试不同的网络架构。