sklearn中Gradient Boosting的基础学习器

我在回归问题中使用了scikit-learn中的GradientBoostingRegressor。在论文Gradient boosting machines, a tutorial的这一部分:

3.2. 指定基础学习器

特定的GBM可以设计为搭载不同的基础学习器模型。

…

常用的基础学习器模型可以分为三类：线性模型、平滑模型和决策树。

他们指定了梯度提升的基础学习器，但在相关的scikit-learn 文档中，我找不到可以指定它的参数。

scikit-learn中的GradientBoostingRegressor使用什么基础学习器？如果有办法指定基础学习器，我该如何做？

回答：

仔细查看您链接的文档页面（强调部分是我的）:

在每个阶段，回归树被拟合在给定损失函数的负梯度上。

所以这里的基础估计器是一个决策树回归器。

你不能在这里更改基础回归器；要做到这一点，你需要回到AdaBoostRegressor模型，它与梯度提升模型有些相似但不完全相同。

请记住，虽然理论上您链接的论文是正确的，但在实践中，提升算法主要与决策树作为基础估计器一起使用是有原因的。简而言之（这里不适合进行完整的阐述），决策树表现出固有的不稳定性，这使得它们的提升（和装袋）集成特别有用，而这对于像线性模型或SVM这样的算法来说并不适用。

学技术