我在回归问题中使用了scikit-learn中的GradientBoostingRegressor
。在论文Gradient boosting machines, a tutorial的这一部分:
3.2. 指定基础学习器
特定的GBM可以设计为搭载不同的基础学习器模型。
…
常用的基础学习器模型可以分为三类:线性模型、平滑模型和决策树。
他们指定了梯度提升的基础学习器,但在相关的scikit-learn 文档中,我找不到可以指定它的参数。
scikit-learn中的GradientBoostingRegressor
使用什么基础学习器?如果有办法指定基础学习器,我该如何做?
回答:
仔细查看您链接的文档页面(强调部分是我的):
在每个阶段,回归树被拟合在给定损失函数的负梯度上。
所以这里的基础估计器是一个决策树回归器。
你不能在这里更改基础回归器;要做到这一点,你需要回到AdaBoostRegressor
模型,它与梯度提升模型有些相似但不完全相同。
请记住,虽然理论上您链接的论文是正确的,但在实践中,提升算法主要与决策树作为基础估计器一起使用是有原因的。简而言之(这里不适合进行完整的阐述),决策树表现出固有的不稳定性,这使得它们的提升(和装袋)集成特别有用,而这对于像线性模型或SVM这样的算法来说并不适用。