我想澄清一点:只要在不同的“分支”中,同一个属性可以在决策树中多次出现,对吗?
回答:
显然,在同一个分支内使用相同的决策是没有意义的。
在不同的分支中,这种推理显然不成立。
考虑经典的XOR(x,y)问题。你可以用两层的决策树来解决它,但你需要在两个分支上对同一个属性进行分割。
If x is true: If y is true: return false If y is false: return trueIf x is false: If y is true: return true If y is false: return false
另一个例子如下:假设你的数据在x=[0;1]范围内是正的,在范围外是负的。一个好的决策树如下所示:
If x > 1: return negativeIf x <= 1: If x >= 0: return positive If x < 0: return negative
这不是同一个决策,所以使用x两次是有意义的。