Home IT技术 sklearn.tree.DecisionTreeRegressor: 当max_leaf_nodes != None时，树的深度大于指定值

sklearn.tree.DecisionTreeRegressor: 当max_leaf_nodes != None时，树的深度大于指定值

IT技术 xiaolong · 2025年5月24日 · 0 Comment

我目前正在处理一个预测问题，我尝试使用scikit-learn的DecisionTreeRegressor来解决这个问题，遇到了以下问题：

当同时指定max_depth和max_leaf_nodes参数来拟合树时，生成的树的深度为max_depth+1。当仅指定max_depth时，生成的树具有正确的深度。

这是否是DecisionTreeRegressor类中的一个错误，还是我错过了关于回归树的一些常识？

我在一台Windows机器上工作，使用的是Python 3.7的Jupyter笔记本。Sklearn版本是0.20.3。实际上，我在使用RandomForestRegressor时发现了这个问题，但也发现了DecisionTreeRegressor存在相同的问题。

我编写了以下简化的示例，您可以自己尝试。只需取消注释max_leaf_nodes=10即可。

我还使用graphviz可视化了这些树，实际上显示了不同深度的树。


感谢任何评论。

回答：
尽管没有文档说明，如果未设置max_leaf_nodes，将使用DepthFirstTreeBuilder来拟合底层的树对象；如果设置了，则使用BestFirstTreeBuilder；这种差异导致生成的树具有不同的深度。
这是一个实现特定的细节，而不是因为决策树的特定特性导致的。
顺便提一下，我要指出，最大叶节点数也会限制最大深度。



相关文章：

重新拟合决策树以增加一层
决策树分类器的精确召回曲线下面积为一个正方形
使用h2o实现决策树
在拟合scikit-learn决策树和随机森林分类器时出现MemoryError
使用Python解释决策树
Sklearn决策树中特定类的决策规则
完美的精确度、召回率和F1分数，但预测结果很差
如何获取决策树中的所有基尼指数？
决策树：预测概率与类别成反比
机器学习算法在数据和步骤未改变的情况下得分变化



	

		 decision-tree machine-learning python scikit-learn





	
		
		
	





	
		
		
			xiaolong
			
		
					
	



		
			Related Posts
			
									
	

		

	
		IT技术 			

	使用LSTM在Python中预测未来值
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		这段代码可以预测指定股票的当前日期之前的值，但不能预测… 
	



									
	

		

	
		IT技术 			

	如何在gensim的word2vec模型中查找双词组的相似性
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我有一个word2vec模型，假设我使用的是googl… 
	



									
	

		

	
		IT技术 			

	dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我试图使用 XGBoost 创建模型。 看起来我成功地… 
	



									
	

		

	
		IT技术 			

	ML Tuning – Cross Validation in Spark
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我在https://spark.apache.org/… 
	



									
	

		

	
		IT技术 			

	如何在React JS中使用fetch从REST API获取预测
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我正在开发一个应用程序，其中Flask REST AP… 
	



									
	

		

	
		IT技术 			

	如何分析ML.NET中多类分类预测得分数组？
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我在ML.NET中创建了一个多类分类项目。该项目可以对… 
	



							

		


	


		
		发表回复 取消回复
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 * 
显示名称 * 
邮箱 * 
网站 
 在此浏览器中保存我的显示名称、邮箱地址和网站地址，以便下次评论时使用。






	
	搜索


标签


2d-vector
a-star
algorithm
apache-spark
artificial-intelligence
auto-keras
bilstm
c#
c++
classification
cluster-analysis
computer-vision
conv-neural-network
cox-regression
cross-validation
data-mining
data-science
decision-tree
deep-learning
geopandas
gradient-descent
image-processing
java
keras
libsvm
linear-regression
logistic-regression
machine-learning
matlab
neural-network
nlp
numpy
openai-api
opencv
pandas
python
python-3.x
pytorch
random-forest
recurrent-neural-network
reinforcement-learning
scikit-learn
statistics
tensorflow
weka


近期文章


使用LSTM在Python中预测未来值
如何在gensim的word2vec模型中查找双词组的相似性
dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的
ML Tuning – Cross Validation in Spark
如何在React JS中使用fetch从REST API获取预测



分类


	IT技术


	
	

		
		

		

			

				
			
			
				
				© 2025 学技术
			京ICP备20017344号-7