正如在机器学习教科书中由Tom M. Mitchell所述,关于决策树的第一个陈述是:“决策树学习是一种近似离散值函数的方法”。能否有人详细解释一下这个陈述,可能还可以用一个例子来证明。提前感谢 🙂 🙂
回答:
在简单的例子中,考虑具有两个属性的观测行;训练数据包含基于这些属性组合的分类(离散值)。学习阶段必须确定以何种顺序考虑哪些属性,以便有效地实现所需的建模效果。
例如,考虑一个模型,它将根据所需的价格范围、菜系和辣度来回答“我应该点什么晚餐?”的问题。训练数据将包含您在各种餐馆体验的历史记录。模型必须确定哪种方式最有效地达到良好的菜肴分类:首先根据菜系排除餐馆,然后考虑价格,最后根据Scoville单位调整选择;或者可能先检查辣度,并首先排除不够辣的选择,然后再考虑其他两个因素。
这是否解释了您所需的内容?