在优化xgboost或lightgbm等提升树算法的超参数时,是否可以直接控制使用提前停止时的最低提升轮数(估算器/树)?不仅仅是最高轮数。这个需求源于观察到,在经过太少轮次后停止训练的模型往往会出现显著的欠拟合(其指标明显不如那些通常有更多提升轮次的最先进模型)。
我所知道的唯一解决方案是间接的:调整一个关联的超参数——学习率(在搜索空间中降低其上限)。如果学习率设置得过高,可能会导致模型欠拟合,从而使训练过早停止,即提升轮数过少。
回答:
您是否尝试过调整设置停止轮数的参数?根据所使用的数据、轮数和学习率,我看到这个参数的设置可以低至5,也可以高达500。
如果您能提供一些样本数据和代码,可能会更容易提出建议。