我想知道是否有办法重用现有的DecisionTreeClassifier来添加另一层。
我的场景如下:
- 我有一些用于分类的数据(数据数组X及其对应的标签y)
- 我用
max_depth=1
在我的(X,y)数据上训练了一个DecisionTreeClassifier。 - 当我对分类器不满意时:
- 重用同一个分类器和相同的数据,在树的底部添加叶子,从而将深度增加1(重要的是我保持相同的树,我只是在底部添加一层叶子,我不是重新训练一个新的DecisionTree,设置
max_depth=n+1
)
- 重用同一个分类器和相同的数据,在树的底部添加叶子,从而将深度增加1(重要的是我保持相同的树,我只是在底部添加一层叶子,我不是重新训练一个新的DecisionTree,设置
使用scikit-learn有办法做到这一点吗?或者使用其他分类器,比如神经网络,你可以先用10个周期训练你的神经网络,然后如果精度不够,再用另外10个周期重新训练,依此类推?
回答:
简短回答:
不,你不能这样做。
详细回答:
DecisionTreeClassifier并不是设计用来再次拟合的。正如你在源代码tree.py的第350行看到的,内部树是使用继承自TreeBuilder的某个类构建的。这个类来自cpython文件_tree.py。你仍然可以尝试通过复制/粘贴其代码片段来调整这个类…但我不推荐这样做,因为这非常麻烦,而且很可能根本行不通。
希望你能找到(或已经找到)其他解决方案,并与我们分享 🙂