我在做一份考试旧卷。我需要使用ID3算法来预测披萨是否会被认为美味。我已经计算了每个类别的数值如下:
配料 = 0.459,辣度 = 0.6,饼皮 = 0.6666,温度 = 0.87399
然而,我现在在构建决策树上遇到了困难。目前我将“配料”作为根节点,但我无法找到第二级的下一个分支,有人有任何关于如何正确进行的建议吗?
回答:
你的问题需要更清晰。你需要告诉我们正样本和负样本的数量。“计算值”的含义是什么?这些值是什么?这些是信息增益吗?请多告诉我们一些你处理的数据类型(部分标记的?连续的?)。你说的“进一步分支”是指什么?你的总属性数量是多少?
http://www.csse.monash.edu.au/courseware/cse5230/2004/assets/decisiontreesTute.pdf
上面的URL包含了基于Tom Mitchell的机器学习书籍对决策树的非常好的解释。