在LightGBM模型中,有两个与bagging相关的参数
bagging_fractionbagging_freq (bagging的频率 0表示禁用bagging;k表示每k次迭代执行一次bagging 注意:要启用bagging,bagging_fraction的值应设置为小于1.0)
我能在gdbt中找到关于这个bagging功能的更详细的解释。那么有没有人能给我一个更详细的解释呢?
回答:
代码执行了文档中所述的操作——它对训练样本进行抽样,抽样大小为bagging_fraction * N_train_examples
。第i棵树的训练是在这个子集上进行的。这种抽样可以为每棵树(即每次迭代)进行,也可以在每训练bagging_freq
棵树后进行。
例如,bagging_fraction=0.5, bagging_freq=10
表示每10次迭代会对0.5*N_train_examples
个条目进行新的抽样