我在进行数据挖掘测试,树的大小对我来说并不重要。有人知道在Weka中是否有办法增加J48树的大小,以便我能够获得更高的准确率吗?或者我应该使用其他树算法?
回答:
Weka中的J48是经典C4.5树生成算法的实现。该算法使用了一个称为剪枝的步骤,通过折叠一些叶子节点和内部节点来避免过拟合。
你可以通过使用选项-U
(“使用未剪枝的树”)来避免这个步骤。这样,树会变得更大,因为没有进行剪枝。
然而,由于过拟合,这个步骤几乎是必需的。没有剪枝的树很可能会过度适应训练数据,缺乏泛化能力,并且在实际分类时使用的真实数据上失去准确性。