有没有好的教程解释在构建样本训练集的决策树的连续迭代过程中如何对样本进行加权?我特别想知道在构建第一个决策树后如何分配权重。
决策树是基于信息增益设计的,我想知道由于前几次迭代中的错误分类被加权,这会如何影响信息增益的使用。
任何好的教程/示例将不胜感激。
回答:
提升简介来自Freund和Schapire,提供了使用Quinlan的C4.5决策树模型的AdaBoost算法的示例。
有没有好的教程解释在构建样本训练集的决策树的连续迭代过程中如何对样本进行加权?我特别想知道在构建第一个决策树后如何分配权重。
决策树是基于信息增益设计的,我想知道由于前几次迭代中的错误分类被加权,这会如何影响信息增益的使用。
任何好的教程/示例将不胜感激。
回答:
提升简介来自Freund和Schapire,提供了使用Quinlan的C4.5决策树模型的AdaBoost算法的示例。