我想了解随机树的知识,但我找不到关于随机树的好参考资料。有人能推荐一些好的参考资料吗?或者有人能解释一下随机树是什么,以及它与决策树有何不同吗?
回答:
随机树的理念是使用多个树来进行预测。这有助于模型更加稳健。
最著名的算法是Leo Breiman在2001年提出的“随机森林”,相关文章如下:Leo Breiman. Random forests. Machine Learning, 45(1):5–32, October 2001.
以下是该算法的关键点:
- 森林中的每一棵树都是基于训练数据的自助样本构建的
- 在每个树节点处,从随机选择的一组变量中选择最佳分割
- 每棵树都完全生长(不进行剪枝)
- 预测结果通过所有树的多数投票决定