使用神经网络和网格搜索进行训练-验证-测试分割

我正在从事机器学习工作，使用神经网络（NN）。

理论上，我熟悉将可用数据集划分为三个部分的常规做法：

我想使用网格搜索来选择一个好的网络架构（我的问题并不太复杂，数据集也不太大，所以这是可行的），但我不确定如何将这种三重分割应用到我的问题中。

单独拟合神经网络（例如使用keras），仅学习权重，就允许将数据集分割成训练集和验证集（使用EarlyStopping回调甚至需要这样做）。

这意味着，在进行网格搜索时，我已经使用训练集和验证集来拟合模型（即，验证集将影响模型的外观）。这意味着，原来的测试集在某种程度上变成了新的验证集，我将使用它来在网格搜索中选择性能最佳的架构。

然后，可以在第二步中使用完整数据集的交叉验证来评估模型性能。

这种方法是正确的，还是我搞混了？

回答：

这意味着，在进行网格搜索时，我已经使用训练集和验证集来拟合模型（即，验证集将影响模型的外观）。

是的，网格搜索有助于使用交叉验证分割策略找到最佳超参数。

这意味着，原来的测试集在某种程度上变成了新的验证集，我将使用它来在网格搜索中选择性能最佳的架构。

使用你的测试集来查看实际性能。网格搜索将根据交叉验证集返回模型的最佳超参数。

学技术