我正在尝试使用h2o训练一个决策树模型。我知道h2o中没有专门的决策树库。但是,h2o有一个随机森林的实现,即H2ORandomForestEstimator。我们可以通过调整随机森林的某些输入参数来在h2o中实现决策树吗?因为在scikit模块(一个流行的Python机器学习库)中我们可以这样做。
在scikit中,代码大致如下
RandomForestClassifier(n_estimators=1, max_features=None, bootstrap=False)
在h2o中是否有等效的代码?
回答:
你可以使用H2O的随机森林(H2ORandomForestEstimator
),设置ntrees=1
以便只构建一棵树,设置mtries
为你数据集中特征的数量(即列数),并设置sample_rate=1
。将mtries
设置为数据集中特征的数量意味着算法将在决策树的每个层次随机从所有特征中抽样。
关于mtries
的更多信息:http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/mtries.html