我试图弄清楚决策树回归预测是如何生成的。我查阅的文档中没有详细解释这一点。
根据sklearn DecisionTreeRegressor文档中关于predict函数的说明:
对于分类模型,返回X中每个样本的预测类别。对于回归模型,返回基于X的预测值。
那么,预测是基于新X值落入的叶节点输出的简单平均值,还是通过其他方式生成的呢?
回答:
正如sklearn的文档(在最后一段)中所提到的,sklearn使用CART算法。而且这里(幻灯片29)指出,CART只是输出样本落入的叶节点的平均值。