我在Weka上尝试为一个数据集找到最佳分类器,并研究了随机树算法的不同最大深度类型。但是我无法理解我得到的结果:当最大深度在3到10之间
时,准确率远高于最大深度>10
的情况。谁能帮我解释这是为什么?更深的树不应该带来更高的准确率吗?
回答:
更深的树在训练集上能带来更高的准确率,而非测试集。深树让你的模型更容易过拟合数据,创建更贴合的决策边界,这通常与类别之间的实际边界不符。
我在Weka上尝试为一个数据集找到最佳分类器,并研究了随机树算法的不同最大深度类型。但是我无法理解我得到的结果:当最大深度在3到10之间
时,准确率远高于最大深度>10
的情况。谁能帮我解释这是为什么?更深的树不应该带来更高的准确率吗?
回答:
更深的树在训练集上能带来更高的准确率,而非测试集。深树让你的模型更容易过拟合数据,创建更贴合的决策边界,这通常与类别之间的实际边界不符。