我构建了两个机器学习模型,其roc_auc_score如下:
模型1训练分数 – 95%测试分数 – 74%
模型2训练分数 – 78%测试分数 – 74%
模型1很可能在过拟合,但两个模型的测试分数相同。那么,这两个模型中哪个表现更好呢?
回答:
我假设这是一个假设性的问题,所有其他条件都是相同的。在这种情况下,我会用奥卡姆剃刀原则来论证,并宣布更简单的模型(可能是模型2)为赢家。
在实际操作中,其他因素也可能很重要。例如,你是否对模型2进行了广泛的超参数调优,从而对测试数据过拟合了?