我有处理神经网络的经验,特别是反向传播类型的神经网络,我知道当引入隐藏层时,传递给训练器的输入之间的依赖关系会成为结果模型的一部分知识。
决策网络是否也如此?
我发现关于这些算法(如ID3)的信息有些难以找到。我能够找到实际的算法,但关于期望/最佳数据集格式和其他概述的信息却很少见。
谢谢。
回答:
决策树实际上非常容易提供数据,因为它们只需要一个数据表,以及你想在哪个数据列(或特征)上进行预测。该数据可以是任何特征的离散或连续值。现在有几种不同类型的决策树,它们对连续和离散值的支持不同。它们的工作方式也不同,因此理解每种类型的工作原理可能具有挑战性。
根据你感兴趣的算法类型,如果你想尝试实现它,可能很难在不阅读实际论文的情况下找到信息。我已经实现了CART算法,唯一的选择是找到关于它的200页的原书。大多数其他处理只详细讨论了像分裂这样的概念,但对其他方面的讨论仅限于高层次。
至于它们是否考虑事物之间的依赖关系。我认为它只假设每个输入特征与预测特征之间存在依赖关系。如果输入与预测特征无关,你就不能用它作为分裂标准。但在其他输入特征之间,我认为它们必须是相互独立的。我得查一下书才能确保这是不是真的,但凭我的直觉,我认为这是真的。