当使用训练集和验证集训练一个多层感知器(MLP)模型时,我们可以确定最适合该模型的训练轮数。一旦训练完成,并且我们知道了最佳的训练轮数,为了获得最佳的MLP模型,是否可以将模型不仅用训练集重新训练,还用整个数据集以相同的轮数重新训练,这样模型可以看到更多的数据?还是说,这个轮数对于第一种方法可能产生一个好的MLP模型,但在第二种方法中可能导致过拟合?
回答:
对此没有单一的解决方法。这取决于多个因素,例如验证策略(例如k折交叉验证与将验证集本身用作测试集),模型是在线学习还是离线学习,以及验证集中是否存在偏见或不平衡的数据。
您可能会发现以下资源有用: